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(57) Abstract 

The invention relates to the nucleotide sequence and the protein sequence derived therefrom, which encodes for the human catalytic 
teiomerasc sub-uniL The invention furthermore relates to methods involving a pharmaceutical, diagnostic or therapeutic use of this 
gene/protein, principally for treating cancer and ageing. 

(57) Zusammenfassung 

Diese Erfindung betrifft die Nukleotidsequenz und die davon abgeleitete Proteinsequenz, die fur die humane katalyusche 
Telomerase-Untereinheit codiert. Daruberhinaus betrifft diese Erfindung Methoden, die eine pharmazeutische, diagnostische oder 
therapeutische Verwendung von diesem Gen/Protein beinhaltet, vor allem in der Behandlung von Krebs und Aliening. 
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Humane katalvtische Telomerase-Untereinheit und deren diagnostische und thera- 
peutische Verwendung 

5 Aufbau und Funktion der Chromosomenenden 

Das genetische Material eukaryontischer Zellen ist auf linearen Chromosomen verteilt. Die 
Enden der Erbanlagen werden, abgeleitet von den griechischen Wortern ielos (Ende) und 
meros (Teil, Segment), als Telomere bezeichnet. Die meisten Telomere bestehen aus 
10 Wiederholungen von kurzen Sequenzen, die uberwiegend aus Thymin und Guanin 
aufgebaut sind (Zakian, 1995). Die Telomersequenzen verwandter Organismen sind oft 
ahnlich und sogar zwischen phyllogenetisch weiter entfernten Spezies konserviert. 
Bemerkenswert ist, dafi in alien bislang untersuchten Wirbeltieren die Telomere aus der 
Sequenz TTAGGG aufgebaut werden (Meyne et al y 1989). 

15 

Die Telomere uben verschiedene wichtige Funktionen aus. Sie verhindern die Fusion von 
Chromosomen (McClintock, 1941) und damit die Entstehung von dizentrischen Erbanlagen. 
Solche Chromosomen mit zwei Centromeren konnen durch Verlust der Heterozygotie bzw. 
Verdopplung oder Verlust von Genen zur Entwicklung von Krebs fuhren. 

20 

Desweiteren dienen Telomere dazu, intakte Erbanlagen von beschadigten zu unterscheiden. 
So stellten Hefezellen ihre Zellteilung ein, wenn sie ein Chromosom ohne Telomer 
enthielten (Sandeli und Zakian, 1993). 

25 Eine weitere wichtige Aufgabe erfullen Telomere bei der DNA-Replikation eukaryontischer 
Zellen. Im Gegensatz zu den zirkularen Genomen von Prokaryonten konnen die linearen 
Chromosomen der Eukaryonten von dem DNA Polymerase-Komplex nicht vollstandig 
repliziert werden. Zur Initiation der DNA-Replikation sind RNA-Primer notwendig. Nach 
Abspaltung der RNA-Primer, Verlangerung der Okazaki-Fragmente und anschlieBender 

30 Ligation fehlt dem neu-synthetisierten DNA-Strang das 5'-Ende, denn dort kann der EINA- 
Primer nicht durch DNA ersetzt werden. Ohne besondere Schutzmechanismen wiirden 
daher die Chromosomen mit jeder Zellteilung schrumpfen ("end-replication problem"; 
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Harley et al y 1990). Die nicht-kodierenden Telomersequenzen stellen vermutlich eine 
Pufferzone dar, urn dem Verlust von Genen vorzubeugea (Sandell und Zakian, 1993). 

Dariiberhinaus spielen Telomere auch eine wichtige Rolle bei der Regulation der zellularen 
5 Alterung (Olovnikov, 1973). Humane somatische Zellen zeigen in Kultur eine limitierte 
Replikationskapazitat; sie werden nach einer gewissen Zeit seneszent. In diesem Zustand 
teilen sich die Zellen selbst nach Stimulierung mit Wachstumsfaktoren nicht mehr, sterben 
aber nicht, sondern bleiben metabolisch aktiv (Goldstein, 1990). Verschiedene 
Beobachtungen sprechen fur die Hypothese, dafl eine Zeile anhand der Lange ihrer 
10 Telomere bestimmt, wie oft sie sich noch teilen kann (Allsopp et aL 9 1992). 

Zusammenfassend besitzen die Telomere somit zentrale Funktionen bei der Alterung von 
Zellen sowie der Stabilisierung des genetischen Materials und Verhinderung von Krebs. 

15 Das Enzvm Telomerase svnthetisiert die Telomere 

Wie oben beschrieben konnen Organismen mit linearen Chromosomen ohne einen speziellen 
Schutzmechanismus ihr Genom nur unvollstandig replizieren. Die meisten Eukaiyonten 
verwenden zur Regeneration der Telomersequenzen ein spezielles Enzym, die Telomerase. 
20 In den bislang untersuchten Einzellern wird Telomerase konstitutiv expremiert. Dagegen 
wurde in Menschen die Telomerase-Aktivitat nur in Keimzellen und Tumorzellen gemessen, 
wogegen benachbartes somatisches Gewebe keine Telomerase enthielt (Kim et ai, 1994). 

Telomerase in Ciliaten 

25 

Die Telomerase wurde, wie auch die Telomere, zuerst im Ciliaten Teirahymena 
thermophila identifiziert. Die Telomerase-Aktivitat wurde durch Verlangerung des einzel- 
strangigen Oligonukleotides d(TTGGGG)4 in Gegenwart von dTTP und dGTP nach- 
gewiesen (Greider und Blackburn, 1985). Dabei wurde an den Primer wiederholt die 
30 7e/ra/iymewa-Telomersequenz TTGGGG angehangt. Selbst wenn als Ausgangsmaterial ein 
Oligonukleotid mit der unregelmafligen Telomersequenz von Saccharomyces cerevisiae, 
T(G)i.3, angeboten wurde, verlangerte die Telomerase den Primer mit der Telomersequenz 
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von Tetrahymena (Greider und Blackburn, 1985). Aus diesen Ergebnissen wurde 
geschlossen, daB die Telomerase selbst die Vorlage fur die Sequenz der Telomere mit sich 
fuhrt 

5 Nachdem zunachst die Existenz einer RNA-Komponente in der Telomerase nachgewiesen 
werden konnte (Greider und Blackburn, 1987), wurde kurze Zeit spater das Gen fur die 
RNA-Untereinheit der Telomerase kloniert (Greider und Blackburn, 1989). Diese RNA 
enthalt eine Region mit dem Komplement zur Telomersequenz von Tetrahymena 
(nachfolgend "Komplement-Region" genannt). Die Telomerase-Aktivitat war abhangig von 
10 der RNA-Komponente, was durch Verdau der RNA mit nachfolgendem Verlust der 
Aktivitat gezeigt werden konnte. Wurde die Telomerase-RNA in ihrer Komplement-Region 
mutiert, so wurden die entsprechenden Mutationen in vivo in die Telomere von 
Tetrahymena eingebaut (Yu et a/., 1990). Die Telomerase gehdrt demnach zur Klasse der 
RNA-abhangigen DNA-Polymerasen. 

15 

Die ersten Protein-Untereinheiten der Tetrahymena-TtXomztasz, p80 und p95, wurden 1995 
identifiziert (Collins et aL, 1995). Die Beobachtung, dafl p95 das Enzym an der DNA 
verankert und p80 die RNA-Komponente bindet, fiihrte zu folgendem Modell: Die 
Telomerase-RNA lagert sich mit ihrer Komplement-Region an den einzelstrangigen 3'- 

20 Uberhang an. Die Verlangerung des 3'-Oberhangs geschieht durch Einbau der 
entsprechenden Nukleotide in 5-3'-Richtung. Die de /?ovo-Synthese von Telomeren 
beinhaltet wahrscheinlich einen Elongations- und einen Translokationsschritt. 1st eine 
Telomersequenz synthetisiert worden, bewegt sich die Telomerase vermutlich an der DNA 
entlang, bis sie wieder in einer Position ist, urn eine vollstandige Telomersequenz 

25 hinzuzufugen. Dieses Modell muC nicht allgemeingultig sein, denn zwischen Telomerasen 
unterschiedlicher Spezies bestehen groBe Unterschiede in der Anzahl der Nukleotide, die 
das Enzym addiert bevor es vom Telomer dissoziiert (Prowse et aL, 1993). 

Daniberhinaus wurden kiirzlich auch Telomerase-Untereinheiten anderer Organismen 
30 identifiziert. In dem Ciliaten Euplotes aediculatus wurden zwei Protein-Untereinheiten, 
pl23 und p43, gefunden, welche keine Homologie zu den Tetrahymena-TtXomtrzst- 
Proteinen zeigen. Die Telomerase-Untereinheit pi 23 weist an ihrem N-Terminus eine 
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basische Domane und am C-Terminus eine Domane fur eine Reverse Transkriptase (RT) 
auf, was auf eine katalytische Funktion dieses Proteins hindeutet (Lingner et al y 1997). 
Dariiberhinaus wurde eine signifikante Homologie von pi 23 zu dem von Lundblad 
gefundenen Protein Est2 aus Saccharomyces cerevisiae beschrieben (Lingner et al. t 1997). 

5 

Wahrend fur p80 und p95 bisher keine essentielle Funktion fur die Telomeraseaktivitat 
nachgewiesen wurde, konnte fur die potentiellen katalytischen Untereinheiten der 
Telomerase pl23/est2p eindeutig eine Schlusselfimktion aufgezeigt werden: Eine Mutation 
des RT-Aktivitatzentrums von est2p fuhrte zu einer signifikanten Verkiirzung der Telomere 
10 in Hefezellen (Lingner et aL, 1 997). 

Telomerase-Komponenten aus Saueerzellen 

Inzwischen wurden die RNA-Komponenten der Telomerasen von verschiedenen Or- 
15 ganismen, unter anderem von Saccharomyces cerevisiae, Mausen und Menschen (Singer 
und Gottschling, 1994; Blasco et a/., 1996; Feng et al. y 1995), kloniert. Alle bislang 
bekannten Telomerase-RNAs enthalten eine Region, die komplementar zu der 
Telomersequenz des jeweiligen Organismus ist. Die Primarsequenz der humanen 
Telomerase-RNA (hTR) weist jedoch keine Ahnlichkeiten mit den RNA-Koraponenten der 
20 Ciliaten oder Saccharomyces cerevisiae auf. Dagegen existieren konservierte Bereiche 
zwischen der humanen und der murinen Telomerase-RNA (Feng et al. f 1995). 

Vor kurzem wurde die Isolation eines humanen Telomerase- assoziertes Proteins (hTPl) 
beschrieben (Harrington et al. y 1997). Das korrespondierende Gen wurde aufgrund seiner 

25 Homologie zu der Tetrahymena Telomerase Untereinheit p80 in einer nicht der 
Allgemeinheit zuganglichen EST Datenbank gefiinden (Harrington et a/., 1997). hTPl ist 
aus 2627 Aminosauren zusammengesetzt und zeigt im N-Teminus drei Domanen, welche 
maximal zu 46% homolog zu p80 sind. AIs weiteres Strukturelement konnten im C- 
terminalen Bereich 16 Wiederholungen aus den Aminosauren Tryptophan und Asparagin 

30 aufgezeigt werden, die vermutlich eine Protein-Protein Interaktion vermitteln. 
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Aktivierung der Telomerase in menschlichen Tumoren 

Eine Aktivitat der Telomerase konnte in Menschen urspriinglich nur in Keimbahnzellen, 
nicht aber in normalen somatischen Zellen (Hastie et al, 1990; Kim et a/., 1994) nach- 

5 gewiesen werden. Nach der Entwicklung eines sensitiveren Nachweisverfahrens (Kim et ai t 
1994) wurde auch in hematopoietischen Zellen eine geringe Telomeraseaktivitat detektiert 
(Broccoli et aL, 1995; Counter et aL t 1995; Hiyama et al y 1995). Allerdings wiesen diese 
Zellen trotzdem eine Reduktion der Telomere auf (Vaziri et a/., 1994; Counter et aL 3 1995). 
Noch ist nicht geklart, ob die Menge an Enzym in diesen Zellen nicht ausreichend fur eine 

10 Kompensation des Telomerverlustes ist, oder ob die gemessene Telomerase-Aktivitat von 
einer Subpopulation, z.B. unvollstandig ausdifferenzierten CD34 + 38 + -Vorlauferzellen, 
hernihrt (Hiyama et al y 1995). Zur Klarung ware ein Nachweis der Telomerase-Aktivitat in 
einer einzelnen Zelle notig. 

1 5 Interessanterweise wurde jedoch in einer groBen Zahl der bislang getesteten Tumorgeweben 
eine signifikante Telomerase-Aktivitat nachgewiesen (1734/2031, 85%; Shay, 1997), 
wahrend in normal em somatischen Gewebe keine Aktivitat gefunden wurde (1/196, <1%, 
Shay, 1997). Verschiedene Untersuchungen zeigten aufierdem, daB in seneszenten Zellen, 
die mit viralen Oncoproteinen transformiert wurden, die Telomere weiterhin schrumpften 

20 und Telomerase nur in der Subpopulation entdeckt werden konnte, die die Wachstumskrise 
iiberlebte (Counter et al y 1992). In diesen immortalisierten Zellen waren auch die Telomere 
stabil (Counter et a/., 1992). Ahnliche Befiinde aus Untersuchungen an M&usen (Blasco et 
ai\ 1996) stutzen die Annahme, dafi eine Reaktivierung der Telomerase ein spates Ereignis 
in der Tumorgenese ist. 

25 

Basierend auf diesen Ergebnissen wurde eine "Telomerase-Hypothese" entwickelt, die den 
Verlust von Telomersequenzen und Zellalterung mit der Aktivitat von Telomerase und der 
Entstehung von Krebs verbindet. In langlebigen Spezies wie dem Menschen kann das 
Schrumpfen der Telomere als ein Mechanismus zur Tumorsuppression angesehen werden. 
30 Ausdifferenzierte Zellen, die keine Telomerase enthalten, stellen bei einer bestimmten Lange 
der Telomere ihre Zellteilung ein. Mutiert eine solche Zelle, so kann aus ihr nur dann ein 
Tumor entstehen, wenn die Zelle ihre Telomere verlangern kann, Ansonsten wurde die Zelle 



WO 98/59040 PCT/EP98/03468 

-6- 

weiterhin Telomersequenzen verlieren, bis ihre Chromsomen instabil werden und sie 
schlieBlich zugrunde geht. Die Reaktivierung der Telomerase ist vermutlich der 
Hauptmechanismus von Tumorzellen zur Stabilisation ihrer Telomere. 

5 Aus diesen Beobachtungen und Uberlegungen ergibt sich, daC eine Inhibition der Te- 
lomerase eine Therapie von Tumoren erlauben sollte. Konventionelle Krebstherapien mit 
Zytostatika oder kurzwelligen Strahlen schadigen nicht nur die Tumorzellen, sondern alle 
sich teilenden Zellen des Korpers. Da aber auBer Tumorzellen nur Keimbahnzellen eine 
signifikante Telomerase- Aktivitat enthalten, wurden Telomerase-Inhibitoren spezifischer die 

10 Tumorzellen angreifen und somit weniger unerwiinschte Nebenwirkungen hervorrufen. In 
alien bislang getesteten Tumorgeweben wurde eine Telomerase-Aktivitat nachgewiesen, so 
daC diese Therapeutika gegen alle Krebsarten eingesetzt werden konnten. Die Wirkung von 
Telomerase-Inhibitoren wurde dann eintreten, wenn die Telomere der Zellen sich soweit 
verkurzt haben, dafl das Genom instabil wird. Da Tumorzellen meist kiirzere Telomere 

15 aufweisen als normale somatische Zellen, wurden zuerst Krebszellen durch Telomerase- 
Inhibitoren eliminiert werden. Zellen mit langen Telomeren, wie die Keimzellen, wurden 
dagegen erst viel spater geschadigt werden. Telomerase-Inhibitoren stellen somit einen 
zukunftsweisenden Weg fur die Therapierung von Krebs dar. 

20 Eindeutige Antworten auf die Frage nach der Art und den Angriffspunkten physiologischer 
Telomerase-Inhibitoren werden aber erst moglich sein, wenn auch die Proteinstrukturen des 
Enzyms mit ihren Funktionen identifiziert und die Erkenntnisse iiber verschiedene Telomer- 
bindende Proteine vertieft sind. 

25 Die Erfindung betrifft die katalytisch aktive humane Telomerase-Untereinheit (phTC) ge- 
gebenenfalls in aufgereinigter Form, aktive Teile des Proteins, Modulatoren, insbesondere 
Agonisten des Proteins, die Funktion des Proteins imitierende Substanzen sowie 
Kombinationen aus diesen Komponenten. 
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Die Erfindung betrifft weiterhin: 

Die Nucleinsauresequenz, die fur das humane Protein phTC kodiert, im einzelnen: 

die genomische Sequenz des hTC-Gens, 

die cDNA-Sequenz des hTC-Gens , 

die DNA-Sequenz von hTC-Varianten 

die Sequenz der mRNA, die vom hTC Gen transkribiert wird, 

Teile aus den oben genannten Sequenzen, darunter die in der Fig. 1 gezeigte 

DNA Sequenz (SEQ ID No. 1) von hTC. 

Die Nucleinsauresequenzen, die in anderen Saugern fur dem hTC homoioge Proteine 
kodieren, im einzelnen: 

die genomischen Sequenzen hTC-homologer Gene, 
die cDNA-Sequenzen hTC-homologer Gene, 

die Sequenzen der mRNAs, die von hTC-homologen Genen transkribiert 
werden, 

Teile aus den oben genannten Sequenzen. 

Nucleinsauresequenzen, die fur dem Protein phTC verwandte Proteine im Menschen 
und anderen Saugern kodieren, im einzelnen: 

die genomischen Sequenzen hTC-verwandter Gene in Mensch und anderen 
Saugern, 

die cDNA-Sequenzen hTC-verwandter Gene in Mensch und anderen 
Saugern, 

die Sequenzen der mRNAs, die von hTC-verwandten Genen transkribiert 
werden in Mensch und anderen Saugern, 
Teile aus den oben genannten Sequenzen. 
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Oligonukleotide in aufgereinigter Form mit einer Sequenz, die identisch oder exakt 
komplementar ist zu einer 10 bis 500 Nukleotide langen, zusammenhangenden 
Sequenz der oben beschriebenen genomischen DNA, cDNA oder mRNA. 

5 Ein solches Oligonukleotid kann insbesondere ein Oligodesoxyribonucleotid oder ein 

Oligoribonucleotid oder eine Peptidnukleotidsaure (PNA) sein 

Bevorzugt sind Oligonukleotide, welche die Aktivitat der Telomerase inhibieren, 
reprimieren oder blockieren, wenn sie an die hTC mRNA binden. 

10 

Eine DNA Sequenz oder eine degenerierte Variation dieser Sequenz, die das Protein 
phTC oder ein Fragment dieses Proteins kodiert, gegebenenfalls enthaltend die DNA 
Sequenz aus Abbildung 1, oder DNA Sequenz, die mit der vorgehend aufgefuhrten 
DNA Sequenz unter Standard-Hybridisierungsbedingungen hybridisiert. 

15 

Ein rekombinantes DNA Molekul, das eine DNA Sequenz oder eine degenerierte 
Variation dieser Sequenz beinhaitet, die phTC oder ein Fragment von phTC kodiert, 
wobei letztere Sequenz bevorzugt die DNA Sequenz aus Abbildung 1 enthalt, oder 
das eine solche DNA Sequenz beinhaitet, die mit der vorgehend aufgefuhrten DNA 
20 Sequenz unter Standard-Hybridisierungsbedirigungen hybridisiert. 

Bevorzugt ist in dem oben genannten rekombinanten DNA Molekul die beschriebene 
DNA mit einer Expressions-Kontrollsequenz verbunden. 

25 Besonders bevorzugt als Expressions-Kontrollsequenz sind z.B. der fruhe oder spate 

Promotor des SV40- oder Adenovirus, das lac System, das trp System, das TAC 
System, das TRC System, die Haupt-Operator- und Promotorregionen des Phagen 
X, die Kontrollregionen des fd Hullproteins, der Promotor der 3-Phospoglycerat 
Kinase, der Promotor der Sauren Phosphatase und der Promotor des a-Mating 

30 Faktors der Hefe. 
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Einen einzelligen Wirt, der mit einem oben beschriebenen rekombinanten DNA ^c?; y>i 

Molekiil transformiert wurde, das die DNA Sequenz oder eine degenerierte Variante 
dieser Sequenz enthalt, die fur das phTC Protein oder einen Teil dieses Protein 
kodiert. In diesem rekombinanten DNA-Molekiil ist die besagte DNA Sequenz mit 
5 einer Expressions-Kontrollsequenz verknupft. 



Bevorzugte Beispiele fur den einzelligen Wirt sind; E. colt, Pseitdomonas, Bacillus, 
Strepiomyces, yeasts, CHO, Rl.l, B-W, L-M, COS 1, COS 7, BSC1, BSC40 und 
BMT10 Zellen, Pflanzenzellen, Insektenzellen und Saugerzellen in Zellkultur. 

10 

Einen rekombinanten Virus, der mit einem der vorstehend beschriebenen DNA 
Molekiile oder einem Derivat oder Fragment dieses Molekuls transformiert vvird. 

Eine Methode zur Inhibition der Telomeraseaktivitat in humanen Zellen, bevorzugt 
neoplastische Zellen, bei der ein exogenes Polynukleotid in die Zellen transferiert 
wird, das aus einer Transkriptionseinheit besteht. Diese Transkriptionseinheit 
beinhaltet eine Polynukleotidsequenz aus mindestens 29 aufeinanderfolgenden 
Nukleotiden, die substantiell identisch oder substantiell komplementar zur hTC RNA 
Sequenz ist und die mit einer heterologen Transkriptions-regulatorischen Sequenz 
verknupft ist, die die Transkription des verknupften Poiynukieotids in besagten 
Zellen steuert. 

Bevorzugt enthalt die oben genannte heterologe Transkriptions-regulatorische 
Sequenz einen Promotor, der in humanen Zellen konstitiitiv aktiv ist. 
25 

Alternativ kann die heterologe Transkriptions-regulatorische Sequenz einen 
Promotor enthalten, der in humanen Zellen durch Zugabe einer regulatorischen 
Substanz induziert oder reprimiert werden kann. Dazu zahlen beispielsweise 
induzierbare und reprimierbare Tetrazyklin-abhangige Promotoren, Heatshock- 
30 Promotoren, Metallionen-abhangige Promotoren. 
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Das obengenannte exogene Polynukleotid kann beispielsweise ein virales Genom mit 
einer Transkriptionseinheit aus der humanen hTC DNA-Komponente sein. 

Besonders bevorzugt produziert die besagte Transkriptionseinheit antisense RNA, 
5 die substantiell komplementar zur humanen hTC RNA-Komponente ist. 

Weiterhin besonders bevorzugt kann das exogene Polynukleotid die Sequenz aus 
Abb. 1 enthalten. 

10 - Ein Polynukleotid fur die Gentherapie einer menschlichen Krankheit. Dieses 
Polynukleotid besteht aus einer Transkriptionseinheit, die eine Polynukleotidsequenz 
aus mindestens 9 aufeinanderfolgenden Nukleotiden enthalt, die substantiell 
identisch oder substantiell komplementar zur hTC RNA Sequenz ist und die mit 
einer heterologen Transkriptions-regulatorischen Sequenz verkmipft ist, die die 

1 5 Transkription des verkniipften Polynukleotids in besagten Zellen steuert. 

Eine Methode zur Detektion Telomerase-assoziierter Zustande in einem Patienten, 
die folgende Schritte umfaOt: 

20 A. Detektion des phTC Proteins in Korperflussigkeiten oder zellularen Proben, 

um einen diagnostischen Wert zu erhalten; 
B. Vergleich des diagnostischen Werts mit Standardwerten fur das phTC 

Protein in standardisierten normalen Zellen oder Korperflussigkeiten des 

gleichen Typs wie die Testprobe; 
25 C. Detektion diagnostischer Werte, die hoher oder niedriger als Stan- 

dardvergleichswerte liegen, indizieren einen Telomerase-assoziierten 

Zustand, der wiederum einen pathogenen Zustand indiziert. 



30 



Bevorzugt wird diese Methode eingesetzt zur Detektion einer neoplastischen 
Erkrankung eines Patienten. Die Methode umfaflt dann folgende Schritte: 
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A. Detektion des phTC Proteins in zellularen Proben, urn einen diagnostischen 
Wert zu erhalten; 

B. Vergleich des diagnostischen Wens mit Standardwerten fiir das phTC 
Protein in nicht-neoplastischen Zellen des gleichen Typs wte die Testprobe; 

C. Diagnostische Werte, die deutlich hoher als Standardvergleichswerte liegen, 
indizieren einen neoplastischen Zustand. 

Eine Methode zur Bestimmung der Gegenwart des phTC Proteins in einer Zelle oder 
zellularen Probe, die auf der Ampliftkation eines hTC-Polynukleotids oder 
Hybridisierung eines hTC-Polynukleotids, Primers oder einer hTC komplernentaren 
Sequenz mit einem hTC Polynukleotid beruhen. 

Ein Testkit zum Nachweis von phTC in zellularen Proben und Korperflussigkeiten, 
wobei markierte, immunchemisch-reaktive Komponenten beispielsweise sein 
konnen: polyklonale Antikorper gegen phTC, monoklonale Antikorper gegen phTC, 
Fragmente dieser Antikorper oder einem Gemisch aus diesen Komponenten. 

Eine Methode zur Verhinderung und/oder Behandlung zellularer (Zer-) Storung 
und/oder Fehlfiinktion und/oder anderer Krankheitsbilder im Menschen, die auf der 
Gabe einer therapeutisch effektiven Menge an katalytisch aktiver humaner 
Telomerase, ihrer funktionellen Aquivalente oder ihrer katalytisch aktiven Fragmente 
beruht. Ebenfalls denkbar ist der Einsatz einer Substanz, die die Produktion 
und/oder Aktivitat von phTC fdrdert; eine Substanz, die die Aktivitat von phTC 
imitieren kann; einer Substanz, die die Produktion und/oder Aktivitat von phTC 
inhibieren kann oder eines Gemisches dieser Substanzen. Weiterhin kann ein 
spezifischer Bindungspartner eingesetzt werden. 

Bevorzugt wird die Methode eingesetzt zur Verhinderung oder Behandlung der 
Alterung oder von Krebserkrankungen. 

Substanzen, die die Aktivitat von phTC beeinflussen, d.h. inhibieren oder fbrdern, 
konnen, werden hier als Modulatoren bezeichnet Solche Modulatoren konnen in an 
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sich bekannter Weise gefunden werden, wenn man in einem Telomerase-Assay ihren 
EinfluB auf die Telomerase-Aktivitat priift. Beispiele fur Telomerase-Assays sind im 
Rahmen von Beispiel 15 angegeben. 

Modulatoren der phTC sind interessant zur Behandlung von Krankheiten, die mit 
Telomerase in Zusammenhang stehen. Insbesondere seien hier die Verhinderung 
oder Behandlung von Alterungsprozessen oder von Krebserkrankungen genannt. 

Eine antisense-Nukleinsaure gegen die hTC mRNA, die eine Nukleotidsequenz 
enthalt, die mit besagter mRNA hybridisiert, wobei die antisense-Nukleinsaure eine 
RNA oder eine DNA ist. 

Bevorzugt bindet die antisense-Nukleinsaure an das Start-Kodon der jeweiligen 
mRNAs. 

Ein rekombinantes DNA Molekul mit einer DNA Sequenz, von der bei der 
Transkription eine antisense-Ribonukleinsaure gegen die hTC mRNA produziert 
wird. Diese besagte antisense-Ribonukleinsaure enthalt eine Nukleinsauresequenz, 
die mit der besagten hTC mRNA hybridisieren kann. 

Ein solches DNA-Molekiil kann zur Herstellung einer Zellinie mit reduzierter 
Expression von phTC eingesetzt werden, indem man eine phTC-produzierende 
Zellinie mit diesem rekombinanten DNA Molekul transfiziert. 

Ein Ribozym, das die hTC mRNA spaltet. 

Bevorzugt ist dies ein Tetrahymena-7yp Ribozym oder ein Hammerhead-Typ 
Ribozym. 

Ein rekombinantes DNA Molekul mit einer DNA Sequenz, deren Transkription zur 
Produktion eines solchen Ribozyms fiihrt. 
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Dieses rekombinante DNA-Molekiil kann eingesetzt werden urn eine phTC- 
produzierende Zellinie zu transfizieren. 

Eine Zusammenstellung, bestehend aus einem Paar von humanen hTC 
5 Polynukleotid-PCR Primern, wobei die Primer bevorzugt aus Sequenzen bestehen, 

die mit der Sequenz der humanen hTC mRNA korrespondieren oder zu dieser 
Sequenz komplementar sind. 

Eine Zusammenstellung, die eine Polynukleotid-Hybridisierungssonde fur das 
10 humane hTC Gen enthalt, wobei die Sonde bevorzugt mindestens 29 aufeinan- 

derfolgende Nukleotide enthalt, die mit der Sequenz des humanen hTC Gens 
korrespondieren oder zu dieser komplementar sind. 

Tiermodelle, mit denen die Telomerase/Telomer-Regulation in vivo untersucht 
15 werden kann. So konnen z.B. mit Knockout- oder transgenen Tieren Tu- 

morentstehung und Altenmg direkt untersucht werden. 

Funktionelle Aquivalente sind im Fall von Proteincn oder Peptiden solche Verbindungen, 
die sich zwar hinsichtlich der Aminosauresequenz unterscheiden konnen, aber im 
20 wesentlichen dieselben Funktionen haben. 

Bekannte Beispiele hierfiir sind Isoenzyme bzw. sogenannte Mikroheterogenitaten bei 
Proteinen. 

25 Im Fall der Oligo- oder Polynucleinsauren sollten unter fiinktionellen Aquivalenten solche 
Verbindungen verstanden werden, die sich in der Nucleotid-Sequenz unterscheiden, aber fur 
das selbe Protein codieren. Dies ist z.B. auf den degenerierten genetischen Code 
zuriickzufiihren. 

30 Erlauterung der Abbildungen: 
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Fig. 1 : cDNA Sequenz der humanen katalytischen Telomerase-Untereinheit (hTC) (SEQ ID 
No. 1). 

Fig. 2: Abgeleitete Aminosauresequenz von der in Fig. 1 dargestellten hTC DNA Sequenz 
(SEQ ID No. 2). 

Die in Fig. 1 dargestellte DNA Sequenz laBt sich von Position 64 bis Position 3461 
vollstandig in eine Aminosauresequenz translatieren. Die Aminosaurereste sind 
entsprechend ihrem Einbuchstabencode dargestellt. 

Fig. 3: Ethidiumbromid-gefarbtes Agarosegel mit unterschiedlich vorbehandelter DNA von 
AA28I296. 

Die Abbildung zeigt ein Ethidiumbromid-gefarbtes 0,8%iges Agarosegel. In den 
Spuren 1 und 8 sind zwei verschiedene DNA GroBenstandards aufgetragen, wobei 
die DNA Fragmentlangen 3, 2, 0.5 und 0.4 kb hervorgehoben sind. Die AA281296 
DNA in pT7T3D wurde mit den Restriktionsenzymen Eco RI /Not I (Spur 3), Pst I 
(Spur 6) und Xho 1 (Spur 7) verdaut. Auf die Spur 2 wurde unverdaute DNA von 
AA281296 in pT7T3D aufgetragen. In den Spuren 4 und 5 wurde 1/10 eines PCR- 
Ansatzes (1 Minute 94°C, 2 Minuten 60°C, 3 Minuten 72°C) mit der hTC cDNA in 
pT7T3D und den Primern 1 (5' GAGTGTGTACGTC-GTCGAGCTGCTCAGGTC 
3 ) und 4 (5' CACCCTCGAGGTGAGACGCTCGGCC 3') [Spur 4] bzw. mit den 
Primern 6 (5' GCTCGTAGTTGAGCACGCTGAACAGTG 3 ) und 7 (5' 
GCCAAGTTCCTGCACTGGCTGATGAG 3') [Spur 5] appliziert. 

Fig. 4: Ausschnitt aus einem Proteinsequenzvergleich der katalytischen Telomerase- 
Untereinheiten vonEuplotes pl23 (pl23) und Mensch (phTC). 
Die Bedingungen (Ktuple, Gap Penalty und Gap Length Penalty) fur den in dieser 
Abbildung dargestellten Lipman-Pearson Proteinvergleich mit der Lasergene 
Programmsoftware (Dnastar, Inc.) sind aufgelistet. Die Aminosaurereste sind 
entsprechend ihrem Einbuchstabencode dargestellt. Die zwischen pi 23 von Evplotes 
aedicttlatus und dem identifizierten EST+| identischen Aminosauren sind ebenfalls 
durch den entsprechenden Buchstaben aus dem Einbuchstabencode hervorgehoben. 
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Nicht identische, aber in der Funktion ahnliche oder vergleichbare Aminosauren sind 
durch ein : gekennzeichnet. 

Fig. 5: Ausschnitt aus einem Proteinsequenzvergleich der katalytischen Telomerase-Unter- 
einheiten von Euplotes pi 23 (pi 23), und Hefe (est2p). 

Die Bedingungen (Ktuple, Gap Penalty und Gap Length Penalty) fur den in dieser 
Abbildung dargestellten Lipman-Pearson Proteinvergleich mit der Lasergene 
Programmsoftware (Dnastar, Inc.) sind aufgelistet. Die Aminosaurereste sind 
entsprechend ihrem Einbuchstabencode dargestellt. Die zwischen pi 23 von Euplotes 
aediculatits und est2p von Hefe identischen Aminosauren sind ebenfalls durch den 
entsprechenden Buchstaben aus dem Einbuchstabencode hervorgehoben. Nicht 
identische, aber in der Funktion ahnliche oder vergleichbare Aminosauren sind durch 
ein : gekennzeichnet. 

Fig. 6: Ausschnitt aus einem Proteinsequenzvergleich der katalytischen Telomerase- 
Untereinheiten von Hefe (est2p) und Mensch (phTC). 

Die Bedingungen (Ktuple, Gap Penalty und Gap Length Penalty) fur den in dieser 
Abbildung dargestellten Lipman-Pearson Proteinvergleich mit der Lasergene 
Programmsoftware (Dnastar, Inc.) sind aufgelistet. Die Aminosaurereste sind 
entsprechend ihrem Einbuchstabencode dargestellt. Die zwischen est2p von Hefe 
und dem identifizierten EST + i identischen Aminosauren sind ebenfalls durch den 
entsprechenden Buchstaben aus dem Einbuchstabencode hervorgehoben. Nicht 
identische, aber in der Funktion ahnliche oder vergleichbare Aminosauren sind durch 
ein : gekennzeichnet. 

Fig. 7: Ausschnitt aus einem Proteinsequenzvergleich der katalytischen Telomerase- 
Untereinheiten von Euplotes pi 23 (pi 23), Hefe (est2p) und Mensch (phTC). 
Der in der Fig. 5 dargestellte Vergleich zwischen Euplotes pi 23 (pl23), Hefe 
(est2p) und Mensch (phTC) wurde mit dem Clustal Method Subprogramm der 
Lasergene Programmsoftware (Dnastar, Inc. ) unter Standardtbedingungen durch- 
gefuhrt. Die Aminosaurereste sind entsprechend ihrem Einbuchstabencode 
dargestellt. Die zwischen est2p von Hefe, pl23 von Euplotes aediculatus und dem 
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identifizierten EST+i identischen Aminosauren sind ebenfalls durch den 
entsprechenden Buchstaben aus dem Einbuchstabencode hervorgehoben. Zusatzlich 
sind die Bereiche, die zwischen alien drei Proteinen identisch sind, durch einen 
hellgrauen Balken oberhalb der Proteinsequenz gekennzeichnet. 

Fig. 8: Generierte DNA Sequenz aus Beispiel 6 (RACE Runde 1) (SEQ ID No. 3). 

Fig. 9: Generierte DNA Sequenz aus Beispiel 6 (RACE Runde 2) (SEQ ID No. 4). 

Fig. 10: Generierte DNA Sequenz aus Beispiel 6 (RACE Runde 3) (SEQ ID No. 5). 

Fig. 1 1 : Generierte DNA Sequenz aus Beispiel 8 (RACE Runde 3) (SEQ ID No. 6). 

Fig.l2:Ubersicht zur Klonierung der vollstandigen hTC cDNA. Die Positionen der Start- 
und Stopcodons sind mit Pfeilen gekennzeichnet. Die schwarzen Bereiche der 
Rechtecke symbolisieren fur Protein kodierende Sequenzabschnitte, wahrend die 
hellgrauen Bereiche 5' und 3' untranslatierte cDNA Regionen symbolisieren bzw. 
fur Intronsequenzen stehen. Die dunkelgrauen Blocke im Rechteck fur die Full 
length cDNA stehen entweder fur das Telomerase-spezifische Motiv (T), oder fur 
die sieben Reverse Transkriptase Motive (Nummer 1-7). 

Die DNA-Fragmente, die zur Darstellung der vollstandigen hTC cDNA notwendig 
sind, sind ebenfalls als Rechtecke dargestellt und entsprechend ihrer Herkunft 
gekennzeichnet. Alle Rechtecke sind in ihrer Position relativ zueinander angeordnet. 
Die Herkunft des DNA-Fragments, fur das das Rechteck AA261296 steht, ist in 
Beispiel 2 beschreiben. Die relative Position der 182 bp Deletion in diesem Fragment 
(vergleiche Beispiel 2) ist durch eine Lucke im Rechteck gekennzeichnet. Die 
Herkunft der DNA-Fragmente, fur die die Rechtecke RACE1, RACE2 und RACE3 
stehen, sind in Beispiel 6 beschreiben. Die Herkunft des DNA-Fragments, fur das 
das Rechteck C5F-Fragment steht, ist in Beispiel 7 beschreiben. Die Herkunft des 
DNA-Fragments, fiir das das Rechteck Lambdal2 steht, ist in Beispiel 9 
beschreiben. Der 3' Teil in dem DNA-Fragment Lambda 12, der fur eine nicht mit 
hTC in Verbindung stehende cDNA codiert (vergleiche Beispiel 9), ist in dieser Ab- 



WO 98/59040 



- 18- 



PCT/EP98/03468 



bildung nicht dargestellt. Die vollstandige hTC-cDNA Sequeaz wurde unter Ver- 
wendung der in dieser Abbildung dargestellten DNA-Fragmente Lambda 12 und 
C5F an den 5' und 3' Splicestellen zusammengefugt (vergleiche Beispiel 7) Diese 
Splicestellen wurden in diversen Fragmenten identifiziert (RACE 1, RACE 3, 
5 Lambda 12 und C5F). 

Fig.l3:Detailausschnitte aus einem Proteinsequenzvergleich der katalytischen Telomerase- 
Untereinheiten von Euplotes und Mensch (hTC). 

Die Abbildung zeigt Ausschnitte aus einem Proteinsequenzvergleich zwischen den 
10 katalytischen Telomerase-Untereinheiten von Euplotes und Mensch (hTC). In den 

umrandeten Boxen sind die Motive fur die Reverse Transkriptase hervorgehoben. 
Die Ziffern unter den Umrandungen beziehen sich auf die jeweilige 
Aminosaureposition in der Fig. 2. Die Aminosaurereste sind entsprechend ihrem 
Einbuchstabencode dargestellt. Identische Aminosauren sind fett gedruckt In der 
15 Konsensussequenz fur das Reverse Transkriptase (RT consensus)-Motiv steht h fur 

eine hydrophobe Aminosaure und p bezeichnet eine polare Aminosaure Sind diese 
Gruppen von Aminosauren in der Aminosauresequenz von Euplotes und hTC 
erhalten, sind p bzw. h fettgedruckt. Sehr hoch konservierte Aminosauren. sind grau 
unterlegt. In RT3 ist die umrandete Box erweitert, um zusatzliche homologe 
20 Aminosauren zu erfassen. Das Telomerase-spezifische Motiv ist in Beispiel 9 

beschrieben. 

Fig.l4:Generierte DNA-Sequenz aus Beispiel 11 (3' Variante) (SEQ ID No. 7). Der nicht 
zu der in Fig. 1 dargestellten DNA-Sequenz homologe Bereich ist fett hervor- 
25 gehoben. 



Fig. 15: hTC Expression in Krebszellinien und in normalem humanen Gewebe. Abb. A: Auf 
dem Northern-Blot wurden nach Angaben des Herstellers (Fa. Clontech) etwa 2 jig 
poly A + RNA aus verschiedenen humanen Zellinien immobilisiert. 1m einzelnen 
30 stammte die RNA aus einem Melanom (G361), einem Lungenkarzinom (A549), aus 

einem Adenokarzinom des Kolons (SW480), aus einem Burkitt Lymphom Raji, aus 
einer Leukamie Zellinie (MOLT-4), aus einer chronischen Leukamie Zellinie (K- 
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562), aus einem Cervixtumor (HeLa) und aus der Leukamie Zellinie HL60. Die 
gekennzeichneten 4,4 kb, 6 kb und 9,5 kb Transkripte sind spezifisch fur hTC 
(vergleiche Beispiel 10). Abb. B: Auf dem Northern-Blot wurden nach Angaben des 
Herstellers (Fa. Clontech) etwa 2 \xg poly A" RNA aus verschiedenen humanen 
Geweben immobilisiert. Im einzelnen wurde die RNA aus Herz, Gehirn, Plazenta, 
Lunge, Leber, Skelettmuskulatur, Niere und Pankreas isoliert. Ein RNA- 
GroBenstandard ist dargestelt. 

Fig. 16: Western-Blot Analyse der Kaninchenseren gegen Peptide aus der humanen 
Telomerase-Aminosauresequenz (Beispiel 12). Jeweils 20 \i\ der bakteriellen Lysate 
aus Beispiel 13 wurden unter zuhilfenahme der Antiseren aus Beispiel 12 in einem 
Western-Blot (Ausubel ei al % 1987) analysiert. In den Spuren 1, 2, 6 und 7 wurden 
Lysate aus Bakterien, die das pMALEST-Konstrukt beinhalten, aufgetragen. In den 
Spuren 3, 4, 8 und 9 wurden Lysate aus Bakterien, die das pMALAl-Konstrukt 
beinhalten, aufgetragen. In den Spuren 1, 3, 6 und 8 sind Lysate aus nicht mit IPTG 
(Isopropyl-beta-thiogalaktopyranosid) induzierten Bakterien aufgetragen. In den 
Spuren 2, 4, 7 und 9 sind Lysate aus mit IPTG induzierten Bakterien aufgetragen. In 
der Spur 5 wurde ein Standardgrofienmmarker (10 kDa Protein-Leiter der Firma 
Life Technologies, Kat. Nr. 10064-012) aufgetragen. Die 50 kDa- und 120 kDa- 
Banden sind am Rande der Membranen gekennzeichnet. Die PVDF-Membran in der 
Abb. A mit den Spuren 1 bis 4 wurde mit Preimmunseren gegen das Peptid B (ver- 
gleiche Beispiel 12) inkubiert. Die PVDF-Membran in Abb. B mit den Spuren 6 bis 
9 wurde mit Preimmunseren gegen das Peptid C (vergleiche Beispiel 12) inkubiert. 
Die PVDF-Membran in der Abb. B mit den Spuren 1 bis 4 wurde mit Immunseren 
gegen das Peptid B (vergleiche Beispiel 12) inkubiert. Die PVDF-Membran in Abb. 
B mit den Spuren 6 bis 9 wurde mit Immunseren gegen das Peptid C (vergleiche 
Beispiel 12) inkubiert. 

Fig. 17; Autoradiogramm von 35 S-markiertem, in vitro translatiertem Protein. In der Spur 1 
wurde das vollstandige in vitro translatierte hTC aufgetragen (vergleiche Beispiel 
15). In der Spur 2 wurde eine C-terminal verkurzte Version von phTC aufgetragen. 
Die Spur 3 zeigt eine vom Hersteller (vergleiche Beispiel 15) gelieferte 
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Positivkontrolle fur die in vitro Translation. Zur Abschatzung der ProteingroBen ist 
auf der rechten Seite ein ProteingroBenstandard gekennzeichnet. 

Fig. 1 8: Autoradiogramm von 32 P-markierten Produkten aus dem TRAP -Assay (vergleiche 
Beispiel 15). In den Spuren 1 und 2 wurde als Negativkontrolle ein TRAP-Assay 
Ansatz ohne Zugabe von Enzym oder Protein aufgetragen. In den Spuren 3 und 4 
wurde als Positivkontrolle ein TRAP-Assay-Ansatz mit partiell aufgereinigter 
humaner Telomerase aus HeLa-Zellen aufgetragen. In den Spuren 5 und 6 wurde ein 
TRAP-Assay-Ansatz mit in vitro translatiertem phTC unverdunnt aufgetragen. In 
den Spuren 7 und 8 wurde ein TRAP-Assay Ansatz mit in vitro translatiertem phTC 
in einer 1:4 Verdunnung aufgetragen. In den Spuren 9 und 10 wurde ein TRAP- 
Assay Ansatz mit in vitro translatiertem phTC in einer 1:16 Verdunnung 
aufgetragen. In den Spuren 1 1 und 12 wurde als Negativkontrolle ein TRAP-Assay 
Ansatz mit in vitro translatierter Luziferase aufgetragen. 

Fig. 19: Autoradiogramm von 32 P-markierten Produkten aus dem direkten Telomerase Assay 
(vergleiche Beispiel 15). In der Spur 1 wurde ein radioaktiv markierter 10 bp- 
Marker aufgetragen. In der Spur 2 wurde ein 5' radioaktiv markiertes Telo- 
meroligonukleotid ([TTAGGGk) aufgetragen. Bei der Spur 3 handelt es sich um eine 
leere Spur. In der Spur 4 wurde als Positivkontrolle partiell aufgereinigte humane 
Telomerase aus HeLa-Zellen im direkten Assay verwendet und das Syntheseprodukt 
aufgetragen. In der Spur 5 wurde das in vitro translatierte phTC aus Beispiel 15 im 
direkten Assay verwendet und das Syntheseprodukt aufgetragen. 
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Beispiele 
Beispiel 1 

5 Es wird heute angenommen, daC weniger als 5 % des humanen Genoms tatsachlich 
transkribiert und in Protein translatiert werden. Durch die gezieite Untersuchung dieser 
kodierenden Genomanteile konnten bereits vor der kompletten Sequenzierung des Genoms 
wichtige Informationen iiber die 60 000 - 70 000 Gene in einer humanen Zelle gewonnen 
werden. Die Automatisierung der Hochdurchsatz-DNA-Sequenziertechnologie in den 

10 letzten 10 bis 15 Jahren ermoglichte es, viele cDNAs aus Plasmid-cDNA-Bibliotheken 
unterschiedlichsten Ursprungs zu sammeln und das jeweilige 5'- bzw. 3'-Ende zu 
sequenzieren. Diese typischerweise 300 bis 400 bp kurzen DNA-Sequenzen werden 
^Expressed Sequence Tags" oder kurz ESTs genannt und sind in verschiedenen 
spezialisierten Datenbanken zusammengefaBt. Der EST-Ansatz wurde zuerst von Okubo ei 

15 a/. (1992) beschrieben und von Adams ei al. (1992) auf einen grofleren MaGstab 
ubertragen. Gegenwartig sind etwa 50 000 Gene aus humanen Zellen teilweise sequenziert 
und als EST-Eintragung dokumentiert. 

Durch den Vergleich mit DNA- und Aminosauresequenzen bekannter Gene konnen ver- 
20 wandte, aber bislang unbekannte Gene in diesen EST-Datenbanken identifiziert werden 
(Gerhold and Caskey, 1996). Ein Suchalgorithmus, der sich hierfur besonders bewahrt hat, 
ist das tBLASTn (Altschul ei a/., 1990). Dieser Algorithmus translatiert jede DNA-Sequenz 
in der EST-Datenbank in alle sechs moglichen Leserahmen und vergleicht diese 
Aminosauresequenzen mit der bekannten Proteinsequenz. 

25 

Mit der kurzlich publizierten Proteinsequenz fiir die katalytische Telomerase-Untereinheit 
aus Euploies aediculahts, pi 23 (Lingner ei ai } 1997), wurde die EST-Datenbank am 
National Center for Biotechnology Information (NCBI) durchsucht. Als Resultat wurde ein 
humaner EST mit der Accession Nummer AA281296 identifiziert, der im Leserahmen +1 
30 eine signifikante Homologie zu pi 23 aufweist. Diese Aminosauresequenz mit dem 
Leserahmen +1 wird im folgenden als EST+i bezeichnet. 
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Die Homologie zwischen pl23 und dem EST*i ist am auffalligsten in zwei Sequenzbe- 
reichen, die durch 30 Aminosauren getrennt sind. Der langere Sequenzbereich, der sich bei 
pi 23 von Aminosaure 438 bis 484 erstreckt, ist zu 38% identisch zu dem 
korrespondierenden Bereich im EST^. Werden auch ahnliche Aminosauren beriicksichtigt, 
liegt die Ubereinstimmung sogar bei 59%. Der zweite Homologieblock erstreckt sich im 
pl23-Protein von Aminosaure 513 bis 530 und weist eine 44%ige Identitat zu dem 
entsprechenden Sequenzabschnitt im identifizierten EST + i auf. Unter Beriicksichtigung von 
Aminosaureresten mit ahnlichen Eigenschaften findet sich eine Uberstimmung von 61%. 

Ein wichtiger Parameter zur Beurteilung einer BLAST-Suche ist der Wert P (Probability). P 
gibt an, mit welcher Wahrscheinlichkeit ein spezifisches Segmentpaar auch in einer BLAST- 
Suche mit einer Zufallssequenz gefiinden wiirde und bewegt sich numerisch zwischen 0 
(Resultat hoch signifikant) und 1 (Ergebnis ohne Bedeutung). So verlief z.B. der Vergleich 
des pi 23 Aquivalents aus Hefe (est2p) mit der NCBI-EST-Datenbank negativ: Der 
gefimdeneEST hatte eine Wahrscheinlichkeit von P=l (Tab. 1). Dagegen weist das humane 
Telomerase- assoziierte Protein 1 (hTPl), das in einer der Allgemeinheit nicht zuganglichen 
EST-Datenbank gefunden wurde (Harrington et al. t 1997), eine Wahrscheinlichkeit von 
P=0.004 auf. 



bekanntes Gen 
(Spezies) 


P 


identifiziertes Gen 


Ursprung der cDNA Bi- 
bliothek 


est2p (Saccharomyces 
cerevisiae) 


0.999 


Ratten EST 


Niere 


p80 (Tetrahymena 
termophilici) 


0.004 


hTPl (Harrington 
etai, 1997) 


Krypten des Darmepithels 


pi 23 {Euplotesae- 
dtculatus) 


3.5*10^ 


AA281296 


Keimzentren der Tonsillen 



Tab. 1 : Vergleich dreier tBlastn-Suchlaufe mit verschiedenen bekannten Genen. 



Der durch den Vergleich mit pi 23 identifizierte humane EST AA281296 hat eine Wahr- 
scheinlichkeit von P=3.5xl0*° 6 . 
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Diese Daten legen nahe, dafi der identifizierte EST aller Wahrscheinlichkeit nach fur ein 
Fragment der katalytischen Untereinheit der humanen Telomerase kodiert. Daher wird das 
korrespondierende Gen im folgenden mit hTC (human Telomerase, catalytic) und das abge- 
5 leitete Protein mit phTC abgekiirzt. 

Beispiel 2 

Der durch den Vergleich mit pi 23 identifizierte EST wurde am 2. April 1997 in die EST- 
10 Datenbank eingespeist und ist in keiner Zeitschrift publiziert. Die cDNA-Bibltothek, in 
welcher dieser EST-Klon vorliegt, wurde laut Angaben des National Center for Bio- 
technology Information wie folgt hergestellt: 

Nach Preparation der mRNA aus den Keimzentren der Tonsillen wurde eine cDNA- 
15 Synthese durchgefiihrt und die doppelstrangigen cDNA-Fragmente gerichtet uber die 
Restriktionsenzymschnittstellen Not I und Eco RI in den Vektor pT7T3D-Pac kloniert. 

Die Sequenzierung der in die EST-Datenbank eingespeisten 389 bp erfolgte uber den - 
28m 13 rev2-Primer der Firma Amersham (DNA-Sequenz siehe Fig. 1 Position 1685 bis 
20 2073). 

Unter Verwendung der Lasergene Programmsoftware (Dnastar Inc.) wurde die DNA- 
Sequenz von EST AA281296 entsprechend des humanen genetischen Codes translatiert. 
Die resultierende Aminosauresequenz (EST +l ) enstpricht der Position 542 bis 670 in Fig. 2. 

25 

Die abgeleitete Proteinsequenz von EST +! setzt sich aus 129 Aminosauren zusammen, 
darunter 27 basische, 1 1 saure, 5 1 hydrophobe und 28 polare Aminosaurereste. 

Der in Beispiel I identifizierte EST ( AA 281296) wurde kommerziell von der Research 
30 Genetics, Inc. (Huntsville) in Form eines in E. colt transformierten Plasmids erworben und 
experimentiell analysiert: 
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Wie in dem Ethidiumbromid-gefarbten Agarosegel der Fig. 3 gezeigt, wird nach 
Restriktionsverdau der hergestellten Plasmid DNA vom EST AA 281296 ein etwa 2,2 kb 
groBes Fragment aus dem Vektor pT7T3D freigesetzt. Anhand einer parallel 
durchgefuhrten Polymeraseketten- (PCR) -Reaktion mit spezifischen internen Primera 
5 wurde der EST AA281296 uberpriift. : Die Lange der erwarteten PCR Produkte liegt bei 
325 und 380 bp und stimmt mit der Lange der experimentell gefundenen Fragmente uberein 
(vergt. Spur 4 und 5 in Fig.3). Damit konnte gezeigt werden, daB der vom Research 
Genetics, Int. (Huntsville) zugesandte E.coli-Klon den identifizierten EST als Plasmid 
beinhaltet. 

10 

Nach DNA-Praparation wurden die insgesamt 2176 bp des Inserts durch Doppelstrang- 
sequenzierung identifiziert. Ein Sequenzvergleich des Klons AA281296 mit der DNA- 
Sequenz des C5F-Fragments (vergleiche Beispiel 7) ergab, daB eine 182 bp Deletion vor- 
liegt (Position 2352 bis 2533, Fig. 1) und sich somit der offene Leserahmen in diesem 
15 Bereich verschiebt. Zusammenfassend setzt sich die DNA-Sequenz von Klon AA281296 
somit aus den Sequenzinformationen der Fig. 1 (Position 1685 bis 2351 und Position 2534 
bis 4042) zusammen. 

Beispiel 3 

20 

Im tBLASTn Vergleich werden nur die Bereiche mit den hochsten Ubereinstimmung zwi- 
schen pl23 und EST +J identifiziert (Aminosauren 438-530, in pl23), wogegen die da- 
zwischenliegenden Aminosauren nicht berucksichtigt werden. Urn Aussagen iiber die Ver- 
wandtschaft der Proteinsequenzen iiber einen groBeren Bereich (Aminosauren 437-554, in 
25 pi 23) zu treffen, wurde ein „Lipman-Pearson Proteinvergleich" durchgefuhrt (siehe Fig. 4). 
Hierbei wurden 34% identische Aminosauren bzw. 59% Aminosauren, die entweder 
identisch oder biochemisch ahnlich sind, gefimden. Dieses Ergebnis zeigt, daB sich auch 
auBerhalb der mit dem tBLASTn gefundenen Homologiebereiche die Verwandtschaft 
zwischen diesen Proteinen fortsetzt. 

30 

Wie kurzlich berichtet (Lingner et al. t 1997), sind pl23 aus Euploies aedicidatus und est2p 
aus Saccharomyces cerevisiae zueinander homolog. Urn den Grad der Verwandtschaft 
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zwischen pi 23 und est2p ins Verhaltnis zu der hier beschriebenen Homologie zwischen 
pi 23 und EST^j zu stellen, wurde die oben beschriebene Region von pi 23 (Aminosauren 
437-554) mit Hilfe des Lipman-Pearson Protein vergleichs unter Verwendung identischer 
Parameter auch mit est2p verglichen. Dabei zeigte sich, dafi pi 23 und est2p in diesem aus- 
5 gewahlten Bereich zu 21% identisch sind bzw. 22% identische Aminosauren oder bio- 
chemisch ahnliche Aminosaurereste aufweisen (siehe Fig. 5). Demnach ist die Homologie 
zwischen EST H und dem pl23 von Euplotes signifikant hoher als zwischen die pl23 und 
est2p. 

10 Beispiel 4 

Die Homologie von pi 23 zu EST + i und est2p legt die Schlufifolgerung nahe, dafl alle 3 
Proteine zur gleichen Proteinfamilie gehoren. Urn diese Annahme zu bestatigen, wurde 
est2p unter den in Beispiel 3 erwahnten Bedingungen mit EST+i verglichen (siehe Fig. 6). 
15 Dabei zeigte sich, dafl EST+i 20% Identitat zu est2p hat, also eine vergleichbare 
Homologie wie pi 23 zu est2p aufweist Diese vergleichsweise geringe Ubereinstimmung 
bestatigt auch den Befund, daB in der tBLASTn-Suche mit est2p kein signifikanter EST 
identifiziert wurde (siehe Beispiel 1). 

20 Beispiel S 

Um fur die Proteinfamilie der katalytischen Telomerase-Untereinheiten aus verschiedenen 
Spezies wichtige, unter Umstanden funktionelle Domanen, zu identifizieren, wurde ein 
Computervergleich mit pi 23, est2p und phTC durchgefuhrt (siehe Fig. 7). Bei dieser 

25 Analyse fallen insbesondere zwei Bereiche auf, die in alien drei Proteinen enthalten sind 
(siehe Fig. 7). Dem Bereich, der bei pl23 den Aminosauren 447 bis 460 entspricht (Fig. 13, 
Telomerase Motiv ) kann gegenwartig keine eindeutige Funktion zugeordnet werden. Eine 
Motiv-Suche mit dem „Wisconsin Sequence Analysis Package" von der „Genetics 
Computer Group" (GCG) und eine Suche in einer Protein-Datenbank (Swissprot, Ausgabe 

30 vom 8.6. 1997) ergaben keine signifikanten Erkenntnisse. 
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Dagegen weist ein zweiter, zwischen p 123, est2p und phTC homologer Bereich, der bei 
p 123 den Aminosauren 512-526 entspricht, ein Konsensus-Motiv fur eine Reverse 
Transkriptase (RT) auf (Fig. 7 und 13). Lingner et al. (1997) konnten zeigen, dafl 
pl23/est2p insgesamt 6 solcher RT-Motive enthalten, die fur die katalytische Funktion von 
5 pl23/est2p essentiell sind. Wie in Fig. 7 und 13 dargestellt, sind in der untersuchten 
Sequenz von phTC auch zwei solcher RT-Motive konserviert. Hierbei handelt es sich urn 
die RT-Motive, welche bei pl23/est2p am weitesten N-terminal lokalisiert sind (Lingner et 
ai } 1997). 

10 Die Primarsequenzen von Reversen Transkriptasen sind stark divergent; nur wenige Amino- 
sauren sind innerhalb eines separaten Motivs vollstandig konserviert (Poch et a/., 1989 und 
Xiong and Eickbush, 1990). Auflerdem unterscheiden sich Reverse Transkriptasen, die von 
Retroviren oder Long Terminal Repeat (LTR) Retrotransposons kodiert werden, durch 
verschiedene Abstande zwischen den konservierten RT-Motiven von solchen Reversen 

15 Transkriptasen, die von Nicht-LTR Retrotransposons oder der Gruppe II Introns kodiert 
werden (Xiong and Eickbush, 1990). Entsprechend des Aufbaus ihrer RT-Motive sind 
pi 23, est2p und phTC letzterer RT-Gruppe zuzuordnen. Interessanterweise entsprechen 
dabei die Konsensussequenzen der RT-Motive in phTC am genauesten dem postulierten 
RT-Konsensus-Motiv: Von acht Aminosaureresten innerhalb der zwei RT-Motive sind bei 

20 phTC 6, bei pi 23 und est2p hingegen nur 5 Aminosauren zu finden (Fig. 7 und 13 ). 
Auffaliig sind hierbei insbesondere die hydrophoben Aminosauren wie Leucin und Isoleucin 
sowie die Aminosauren Lysin und Arginin in bestimmten Positionen (Fig. 7 und 13). 

Zusammenfassend konnte hiermit auf deskriptiver Ebene gezeigt werden, daO der aufgrund 
25 seiner Homologie zu pi 23 identifizierte Klon AA281296 ein Fragment der katalytischen 
Untereinheit der humanen Telomerase darstellt. 

Beispiel 6 

30 Zur Klonierung des 5'-Endes der hTC-cDNA wurden zusatzlich zu dem in Beispiel 8 auf- 
gefuhrten Homologiescreening drei aufeinanderfolgende RACE (rapid amplification of 
cDNA ends)-Reaktionen durchgefuhrt. Als cDNA-Quelle wurde Marathon-Ready cDNA 
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(Fa. Clontech) aus der humanen Leukamiezellinie K562 bzw. aus humanem Testisgewebe 
eingesetzt. Nachfolgend ist die Durchfuhrung sowie das Ergebnis der einzelnen RACE- 
Runden beschrieben. 

5 Dariiberhinaus wurden die Sequenzinformationen der RACE-Runden genutzt, urn per PCR 
die Einzelfragmente als einen zusammenhangenden cDNA-Klon zu amplifizieren. 

RACE-Runde 1 : 

10 In einem Endvolumen von 50 ^1 wurden 5 \xl K562 Marathon-Ready cDNA (Fa. Clontech, 
Katalognummer 7441-1) mit 10 pmol dNTP-Mix versetzt und in 1 x Klen Taq PCR- 
Reaktionspuffer und 1 x Advantage Klen Taq Polymerase Mix (Fa. Clontech) eine PCR- 
Reaktion durchgefuhrt. Als Primer wurden 10 pmol des internen genspezifischen Primers 
GSP2 (5'-GCAACTTGCTCCAGACACTCTTCCGG-3') aus dem S'-Bereich des hTC- 

15 EST-Klons sowie 10 pmol des Marathon Adaptor Primers API (5'- 
CC ATCCTAATACGACTCACTATAGGGC-3 Fa. Clontech) zugefugt. Die PCR wurde 
in 4 Schritten durchgefuhrt. Nach einer einminiitigen Denaturierung bei 94°C wurde uber 5 
Zyklen fur 30 sec bei 94°C denaturiert und anschlieBend fur 4 min bei 72°C die Primer 
angelagert und die DNA-Kette verlangert. Es folgten 5 Zyklen, bei denen fur 30 sec die 

20 DNA bei 94°C denaturiert wurde, die anschlieBende Primerverlangerung aber fur 4 min bei 
70°C erfolgte. AbschlieBend wurden dann 22 Zyklen durchgefuhrt, bei denen nach den 30 
sec DNA-Denaturierung die Primeranlagerung und Kettenverlangerung fur 4 min bei 68°C 
stattfand. 

25 Im AnschluB an diese PCR wurde das PCR-Produkt 1:50 verdunnt. Funf id dieser Ver- 
dunnung wurden in einer zweiten „nested" PCR zusammen mit 10 pmol dNTP-Mix in 1 x 
Klen Taq PCR-Reaktionspuffer und 1 x Advantage Klen Taq Polymerase-Mix sowie 10 
pmol des Primers GSP2 und 10 pmol des ..nested" Marathon Adaptor Primers AP2 (5'- 
ACTC ACT ATAGGGCTCGAGCGGC-3 ' ; Fa. Clontech) eingesetzt. Die PCR-Bedingungen 

30 entsprachen den in der ersten PCR gewahlten Parametern. Als einzige Ausnahme wurden im 
letzten PCR-Schritt statt 22 Zyklen nur 16 Zyklen gewahlt. 
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Als Produkt dieser Nested-RACE-PCR wurde ein 1 153 bp langes DNA-Fragment erhalten. 
Dieses wurde in den TA-CIoning Vektor pCRll der Fa. InVitrogen kloniert und 
vollstandig doppelstrangig sequenziert (Fig. 8 und SEQ ID No. 3). 

5 Die Nukleotide 974 bis 1 153 reprasentieren die in Fig. 1 dargestellte Nukleotidregion 1629 
bis 1808 der hTC-cDNA. Bei dem von bp 1-973 reichenden Nukleotidbereich, der keine 
Homologie zu der in Fig. 1 gezeigten hTC-cDNA-Sequenz aufweist, handelt es sich urn 
Intronsequenzen des hTC-Gens (Daten nicht gezeigt). Eine 3'-Splice-Konsensussequenz ist 
am Exon-Intron-Ubergang zu finden. Die Prasenz von Intronsequenzen konnte auf 
10 unvollstandig gesplicte mRNA als Ausgangssubstanz fur die cDNA-Synthese 
zuruckzufiihren sein. Auch genomische DNA-Kontaminationen in der cDNA konnten das 
Auffinden von Intronsequenzen erklaren. 

RACE-Runde 2: 

15 

Basierend auf den Sequenzdaten der ersten RACE-Runde wurde eine zweite RACE mit 
dem genspezifischen Primer GSP5 aus der 5'-Region von RACE-Produkt 1 (5'- 
GGCAGTGACCAGGAGGCAACGAGAGG-3') sowie dem API -Primer durchgefuhrt. Als 
cDNA-Quelle wurde Marathon-Ready cDNA aus humanem Testis (Fa. Clontech; 

20 Katalognummer 7414-1) verwendet. Es wurden gleiche PCR-Bedingungen wie bei der 1. 
PCR in RACE-Runde 1 gewahlt. Auch in RACE-Runde 2 wurde an die I. PCR eine 2. 
„nested" PCR mit verdunntem PCR-Produkt als cDNA-Quelle angeschlossen. Als ^nested" 
PCR-Primer wurden der genspezifische Primer GSP6 aus der 5' -Region von RACE- 
Produkt 1 (S'-GGCACACTCGGCAGGAAACGCACATGG-S 1 ) sowie der AP2-Primer 

25 genutzt. Die Bedingungen entsprachen den Parameters der Nested-PCR aus RACE-Runde 
1. 

Das 412 bp lange PCR-Produkt der Nested-PCR aus RACE-Runde 2 wurde in den TA- 
Cloning Vektor pCRII-Topo der Fa. Invitrogen kloniert und vollstandig sequenziert (Fig. 9 
30 und SEQ ED No. 4). Der Sequenzabschnitt von bp 267 bis bp 412 ist komplett homolog zu 
dem 5'-Bereich des Produktes aus RACE 1. Die Region von bp 1 bis bp 266 verlangert 
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RACE-Produkt 1 am 5'-Ende. Bei diesem RACE-Produkt 2 handelt es sich wahrscheinlich 
komplett um einen Intronbereich des hTC-Gens (Daten nicht gezeigt). 

RACE-Runde 3 : 

5 

Eine dritte RACE-Runde fuhrte zur Identifizierung von weiter 5'-geIegenen hTC-cDNA- 
Regionen. Ausgehend von den Sequenzergebnissen der RACE-Runde 2 wurde ein 
genspezifischer Primer GSP9 (5'-CCTCCTCTGTTCACTGCTCTGGCC-3') aus dem 5'- 
Bereich des RACE-Produkts 2 gewahlt und zusammen mit dem API -Primer und Marathon- 

10 Ready cDNA aus humanem Testis (Fa. Clontech) in einer neuen RACE eingesetzt. Die 
RACE-Bedingungen glichen denen der 1. PGR in RACE 1 und 2. In der nachfolgenden 
„nested" RACE, die, entsprechend der „nested"-RACE in Runde 1 und 2, mit dem 
genspezifischen Primer GSP 10 aus dem 5 '-Bereich von RACE-Produkt 2 (5'- 
CGTAAGTTTATGCAAACTGGACAGG-3') und AP2 erfolgte, wurde ein 1012 bp langes 

15 Fragment (Fig. 10 und SEQ ED No. 5) amplifiziert und in den TA-Cloning Vektor pCRII- 
TOPO kloniert. Die nachfolgende Sequenzierung zeigte, dafl die 3'-Region dieses RACE- 
Fragments (bp 817 - bp 1012) offensichtlich noch Intronsequenz des hTC-Gens darstellt. 
Komplett homolog zur 5'-Region von RACE-Produkt 2 ist der Bereich von bp 889-1012. 
Dagegen ist der 5' -Bereich dieses Fragments von bp 1-bp 816 identisch mit der in Fig. 1 

20 gezeigten Region von bp 814 - bp 1629 der hTC-cDNA. Eine potentielle 5'-Splice- 
Konsensussequenz ist am Exon-Intron-Ubergang zu finden. 

Beispiel 7 

25 Zur Klonierung eines zusammenhangenden Fragments aus den Sequenzinformationen von 
RACE 2 und dem Klon AA281296 wurde eine PCR durchgefiihrt. Als cDNA-Quelle wurde 
Marathon-Ready cDNA aus humanem Testis (Fa. Clontech; Katalognummer 7414-1) 
verwendet Der PCR Ansatz erfolgte wie unter RACE 1 (vergleiche Beispiel 6) beschrieben, 
allerdings mit den Primern C5F (5 '-CGAGTGGAC ACGGTGATCTCTGCC-3 ') aus der 5' 

30 Region von RACE 2 und dem Primer C3B (5'- GCACACCTTTGGTCACTCCAAATTCC- 
3') aus der 3' Region vom Klon AA281296. Die PCR wurde in 2 Schritten durchgefiihrt. 
Nach einer einminQtigen Denaturierung bei 94°C wurde uber 36 Zyklen fur 30 sec bei 94°C 



WO 98/59040 



-30- 



PCT/EP98/03468 



denaturiert und anschlieOend fiir 4 min bei 68°C die Primer angelagert und die DNA-Kette 
verlangert. 

Als Produkt dieser PCR wurde ein 2486 bp langes DNA-Fragment, im folgenden als C5F- 
5 Fragment bezeichnet, erhalten. Dieses wurde in den TA-Cloning Vektor pCRII-TOPO der 
Fa. Invitrogen kloniert und vollstandig doppelstrangig sequenziert. Ein Sequenzvergleich 
von dem C5F-Fragment mit DNA-Sequenz vom Klon AA281296 ergab, dafl zwischen dem 
RT-Motiv 3 und RT-Motiv 4 eine 182 bp lange in frame Insertion vorliegt (Position 2352 
bis 2533, Fig.l). Ein weiterer Vergleich der DNA vom C5F-Fragment mit den Sequenzen 
10 der drei RACE-Runden machte deutlich, daB am 3' Ende von C5F ein bereits in RACE 2 
identifiziertes Intron vorliegt. Eine 3*-Splice-Konsensussequenz ist am Exon-Intron- 
Ubergang zu finden. Zusammenfassend setzt sich die DNA-Sequenz vom C5F-Fragment 
somit aus den Sequenzinformationen der Fig. 9 (Position 64 bis 278) und den Sequenzdaten 
der Fig. 1 (Position 1636 bis 3908) zusammen. 

15 

Beispiel 8 

Zur Klonierung des 5'-Endes der hTC-cDNA wurden zusatzlich zu dem in Beispiel 6 aufge- 
flihrten RACE-ProtokolI ein Homologiescreening (Ausubel et a/., 1987) durchgefuhrt. Als 

20 cDNA-Quelle wurde eine humane Erythroleukemia 5 '-Stretch Plus cDNA Bibliothek (Fa. 
Clontech, Kat. Nr. HL5016b) aus der humanen Leukamiezellinie K562 verwendet. Etwa 
3xl0 6 Pfu dieser random und oligo dT geprimten Bibliothek wurden wie bei Ausubel et ai y 
(1987) ausplattiert und zum Screening eingesetzt. Als Probe wurde ein 719 bp langes 
(Position 1685 bis 2404, entsprechend der Fig. 1) radioaktiv markiertes hTC-DNA- 

25 Fragment benutzt. 

Von 20 putativ positiven X Klonen konnte nach einem Rescreening mit der gleichen hTC- 
Sonde der K Klon 12 als positiv verifiziert werden. Nach Plaqueaufreinigung und X DNA- 
Praparation (Ausubel et al. t 1987) wurde das 4kb Insert in den Vektor pBluescript 
30 umkloniert und durchsequenziert (Fig. 1 1 und SEQ ID No. 6). 
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Ein Vergleich der X Klon 12-Sequenz mit den Sequenzen der RACE-Klone und der DNA- 
Sequenz vom Klon AA281296 ergab, daB dieser im Homologie Screening identifizierte 
Klon fur einen 5' Teil der hTC-cDNA kodiert und ein putatives ATG-Startcodon in 
Position 63 entsprechend der Fig. 1 aufweist. 5' von diesem ATG liegt kein Stopcodon im 
5 gleichen Leserahmen vor. Weitere Sequenzanalysen machen deutlich, daB der X Klon 12 
von Position 1656 bis 2004 wahrscheinlich ein Intron enthalt. Sehr gut konservierte 5 ' und 
3' Splicestellen belegen diese Hypothese. Die fur die hTC-cDNA kodierende Sequenz setzt 
sich dann von Position 2005 bis Position 2382 fort. Die Sequenz von 2383 bis zum 3 Ende 
vom X Klon 12 weist einen auffalligen offenen Leserahmen in Leseraster -4 auf. Eine 
10 bioinformatorische Analyse der entsprechend en DNA-Sequenz zeigte, dafl dieser 
Leserahmen uber etwa 400 bp identisch zu diversen ESTs ist, die in keinem Zusammenhang 
zur hTC-cDNA stehen. Somit handelt es sich bei dem X Klon 12 urn einen chimaren Klon, 
der sich im wesentlichen aus dem 5' Ende der hTC cDNA und einem weiteren cDNA-Klon 
unbekannter Funktion zusammensetzt. 

15 

Eine zusammenfassende schematische Darstellung mit der rclativen Orientierung der 
RACE-Produkte und des Homologiescreenings ist in Fig. 12 dargestellt. Die vollstandige 
Sequenz der hTC-cDNA (Fig. 1) wurde aus dem X Klon 12 (Position 21 bis 1655 
entsprechend der Fig, 11), dem PCR-Produkt C5F (Position 1636 bis 3908 entsprechend 
20 der Fig. 1) und dem EST AA281296 (Position 3909 bis 4042 entsprechend der Fig. 1) 
zusammengesetzt. 

Beispiel 9 

25 Durch einen Vergleich der phTC-Proteinsequenz (Fig. 2 und SEQ ID No. 2) mit einer 
Konsensussequenz von Reversen Transkriptasen (Poch et 1989, Xiong and Eickbush, 
1990) wurden insgesamt sieben Motive fur Reverse Transkriptasen (RT-Motive) 
identifiziert (Fig. 13). Innerhalb dieser Motive sind einige Aminosauren nicht nur zwischen 
der RT-Konsensussequenz und dem phTC, sondern auch im Vergleich zu dem Telomerase- 

30 protein aus Enplotes hoch konserviert. So sind z.B. in RT-Motiv 5 zwei Asparaginsauren 
(Position 868 und 869 in Fig. 2) vollig konserviert (Fig. 13). Das aus anderen Reverse 
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Transkriptasen abgeleitete RT-Motiv 7 (Poch et aL, 1989, Xiong and Eickbush, 1990) 
vvurde nur in der humanen katalytischen Telomeraseuntereinheit aufgezeigt, nicht in dem 
Eitploles-Protem (Fig. 13). 

5 Auffallig sind weiterhin Strukturmerkmale, die sich nur in den Telomeraseproteinen, nicht 
jedoch in anderen Reverse Transkriptasen aufzeigen lassen. Das Telomerase Motiv 
(Position 553 und 565 in Fig. 2) ist eine fur diese Proteinfamilie spezifische Struktur, da es 
in keinem bisher bekannten Protein vorkommt. Ein weiteres nur in den katalytischen 
Telomeraseproteinen identifiziertes Merkmal ist der Abstand zwischen den RT-Motiven 3 
10 und 4, der mit 107 Aminosauren deutlich grofier ist als in anderen RTs. Diese 
Besonderheiten erlauben die Schluflfolgerung, dafl die katalytischen Untereinheiten der 
Telomerasen aus verschiedenen Spezies wahrscheinlich eine eigene Untergruppe der RNA- 
abhangigen DNA-Polymerasen darstellt. 

15 Beisniel 10 

Die Expression der Telomerase RNA-Untereinheit (hTR) korreliert nicht mit der 
Telomeraseaktivitat, sondern wird ubiquitar beobachtet (Feng et a/., 1995). Somit stellt sich 
die Frage, ob die Auspragung dier katalytischen Telomerase-Untereinheit mit der 
20 Telomeaseaktivitat einhergeht 

Um das hTC-Expressionslevel zu analysieren, wurden Northern Blot-Experimente (Ausubel 
et aL, 1987) durchgefiihrt. Die kommerziell erhaltlichen Northern Blots waren entweder mit 
einer Reihe von RNA-Praparationen aus normalem, humanem Gewebe (Fa. Clontech; 
25 Katalognummer 7760-1) oder mit RNA-Proben aus humanen Krebszellinien (Fa. Clontech; 
Katalognummer 7757-1) bestOckt. Als Probe wurde ein 719 bp langes (Position 1685 bis 
2404, entsprechend der Fig.l) radioaktiv markiertes hTC-DNA-Fragment benutzt. Die 
Inkubation der Membranen mit der Probe erfolgte nach Angaben des Herstellers (Fa. 
Clontech). 

30 

In den acht getesteten humanen Zellinien (3 Leukamiezellinien, 3 Carcinomzellinien, ein 
Melanom und ein Lymphom) wurden zwei RNA-Haupttranskripte in der GroBe von etwa 
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9,5 kb und 4,4 kb und ein RNA-Nebentranskript von etwa 6 kb nachgewiesen, die mit der 
Probe kreuzhybridisieren (Fig. 15, Abb. A). Die hTC mRNA wurde im Vergleich am 
starksten in den Leukamie Zellinien K-562 und HL-60 exprimiert (Fig. 15, Abb. A). Im 
Gegensatz dazu war das hTC-Transkript in den getesteten normalen Geweben (Herz, 
5 Gehirn, Plazenta, Lunge, Leber, Skelettmuskel, Niere und Pankreas) nicht nachzuweisen 
(Fig. 15, Abb. B). Diese Beobachtung ist nicht uberraschend, da in diesen Geweben auch 
keine Telomeraseaktivitat nachgewiesen werden konnte (Kim et aL, 1994). 

Diese Daten deuten darauf hin, dafl die Induktion der hTC Expression fur die Aktivierung 
1 0 der Telomerase wahrend der Tumorentstehung eine wesentliche Rolle spielt. 

Beispiel 11 

Bei der PCR-Amplifikation der hTC-cDNA-Fragmente aus verschiedenen cDNA-Banken 
15 (Marathon Ready cDNA der Fa. Clontech aus der humanen Leukamiezellinie K562 und aus 
humanem Testis sowie cDNA aus der humanen pramyeloischen Leukamiezellinie HL60) 
wurden stets mehrere PCR-Produkte erhalten, die in ihrer GroBe minimal voneinander 
abwichen. Urn die Unterschiede zwischen den verschiedenen hTC-PCR-Produkten 
aufzuklaren, wurde mit den Primern C5A (5'-CCGGAAGAGTGTCTGGAGCAAGTTGC- 
20 3') und C3B (5 '-GCAC ACCTTTGGTC ACTCCAAATTCC-) ein von bp 1783 bis bp 3901 
reichendes Fragment der in Fig. 1 dargestellten hTC-cDNA amplifiziert. Als cDNA-Quelle 
wurde Marathon-Ready cDNA aus K562-Leukamiezellen (Fa. Clontech; Katalognummer 
7441-1) verwendet (PCR1 und 2). In einer dritten PCR wurde mit den Primern GSPlvor 
(5 ' -GGCTGATGAGTGTGTACGTCGTCGAG-3 ') und HTRT3 A (5 * - 
25 GGGTGGCC ATC AGTCC AGGATGG-3 ') ein hTC-Fragment von bp 1695 bis bp 3463 der 
hTC-cDNA in Fig. 1 aus HL60-cDNA amplifiziert. 

Nachfolgend sind die Bedingungen der 3 PCR-Reaktionen beschrieben: 

30 In der ersten PCR wurden in einem Endvolumen von 50 \i\ 5 jjlI K562 Marathon-Ready 
cDNA mit 10 pmol dNTP-Mix versetzt und in 1 x Klen Taq PCR-Reaktionspuffer und 1 x 
Advantage Klen Taq Polymerase Mix (Fa. Clontech) eine PCR-Reaktion durchgefiihrt. Je 



WO 98/59040 PCT/EP98/03468 

-34- 

10 pmol der Primer C5A und C5B wurden zugefiigt. Die PCR wurde in 3 Schritten 
durchgefiihrt. An eine einminiitige Denaturierung bei 94°C schlossen sich 35 PCR-Zyklen 
an, in denen die DNA zunachst fur 30 sec bei 94°C denaturiert wurde und anschlieBend fur 
4 min bei 68°C die Primer angelagert und die DNA-Kette verlangert wurde. Zum AbschluB 
5 folgte fur 10 min eine Kettenverlangerung bei 68°C. Die entstandenen PCR-Produkte 
wurden in den TA-Cloning Vektor pCRII-TOPO der Fa. InVitrogen kloniert. 

In einer zweiten PCR wurden 5 |il K562 Marathon-Ready cDNA mit je 10 pmol der Primer 
C5A und C3B, 10 pmol dNTP-Mix und 2 U Taq-DNA-Polymerase (Fa. Gibco-BRL) 

10 versetzt und in einem Endvolumen von 50 |il eine PCR-Reaktion in lx PCR-Puffer der Fa. 
Perkin Elmer durchgefiihrt. Die PCR-Reaktion erfolgte in 3 Schritten. Zunachst wurde die 
DNA fur 3 min bei 94°C denaturiert. Es folgten 34 Zyklen, bei denen aufeinanderfolgend 
die DNA fur 45 sec bei 94°C denaturiert wurde, anschlieBend fiir 1 min bei 68°C die 
Primeranlagerung erfolgte und danach fur 3 min bei 72°C die DNA-Kette verlangert wurde. 

15 Im letzten PCR-Schritt wurde fur 10 min bei 72°C eine abschlieOende Kettenverlangerung 
durchgefiihrt. Die entstandenen PCR-Produkte wurden in den TA-Cloning Vektor pCR2. 1 
der Fa. InVitrogen kloniert. 

Fiir die dritte PCR wurde zunachst mit dem cDNA-Synthese-Kit der Fa. Boehringer Mann- 
20 heim aus 2 p.g DNasel-behandelter Poly A-RNA der humanen pramyeloischen Zellinie 
HL60 eine cDNA-Synthese entsprechend den Angaben der Hersteller durchgefiihrt. In 
einem Endvolumen von 50 fjtl wurde anschlieBend 1 |al dieser HL60-cDNA mit je 10 pmol 
der Primer GSPlvor und HTRT3A sowie 10 pmol dNTP-Mix gemischt und nach Zusatz 
von 1,25 \xl DMSO in 1 x Klen Taq PCR-Reaktionspuffer und 1 x Advantage Klen Taq 
25 Polymerase Mix (Fa. Clontech) eine PCR-Reaktion durchgefiihrt. Die PCR-Reaktion verlief 
in 3 Schritten. Nach einer Denaturierung fiir 3 min bei 94°C wurde liber 37 Zyklen die DNA 
zunachst fur 1 min bei 94°C denaturiert und anschlieBend fur 4 min bei 68°C die Primer an- 
gelagert und die DNA-Kette verlangert. AbschlieBend erfolgte noch eine Inkubation fur 
10 min bei 68°C. Die PCR-Produkte wurden in den TA-Cloning Vektor pCR 2.1-TOPO 
30 kloniert. 
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Die vollstandige Doppelstrangsequenzierung der aus PCR 1 und 2 klonierten hTC-cDNA- 
Fragmente sowie die partielle Sequenzierung der aus PCR 3 erhaltenen hTC-cDNA- 
Fragmente zeigte, daB zusatzlich zu der in Fig. 1 dargestellten hTC-cDNA 4 Varianten 
dieser cDNA in humanen Zellen existieren: 

5 

Variante 1 der humanen hTC-cDNA zeichnet sich durch eine 182 bp lange Deletion der 
Nukleotide 2345 bis 2526 aus. Durch diese Deletion kommt es zu einer Verschiebung im 
ORF und es wird ein verkurztes hTC-Protein abgelesen, dem die RT-Motive 4 bis 7 fehlen. 

10 Variante 2 der humanen hTC-cDNA weist eine 36 bp lange Deletion der Nukleotide 2184 
bis 2219 auf. Durch diese Deletion geht das RT-Motiv 3 verloren. Der Leserahmen bleibt 
jedoch erhalten und es wird ein Protein hergestellt, dem selektiv das RT-Motiv 3 fehlt. 

Variante 3 der humanen hTC-cDNA stellt eine {Combination der Varianten 1 und 2 dar. Sie 
15 weist sowohl eine Deletion der bp 2184 bis 2219 als auch der bp 2345 bis 2526 auf. 

Variante 4 der humanen hTC-cDNA zeichnet sich durch den Verlust des Nukleotidbereichs 
von bp 3219 bis 3842 aus. Diese fehlende Sequenz ist durch eine nicht zu hTC homologe 
Sequenz ersetzt Ab bp 3843 ist die Sequenz wieder vollig identisch zu der in Fig. 1 darge- 
20 stellten hTC-Sequenz. Die Sequenz der Variante 4 ist in Fig. 14 dargestellt. Entsprechend 
des gewahlten 5'-Primers beginnt sie mit bp 1783 der in Fig. 1 dargestellten hTC-cDNA. 
Der nicht-homologe Bereich ist fett hervorgehoben und stimmt von Position 3219 bis 
Position 3451 (Fig. 14 und SEQ ID No. 7) auf DNA Ebene zu 98,7% mit einem EST 
(Accession Nr. AA299878) aus einem humanen Uterustumor uberein. 

25 

Beispiel 12 

Zur Gewinnung von Antiseren mit Spezifitat fur die katalytische Untereinheit der humanen 
Telomerase wurde die vorhandene Nukieotidsequenz (Fig. 1) in eine Aminosauresequenz 
30 ubersetzt (Fig. 2). Mit Hilfe eines Programms zur Sekundarstrukturvorhersage (PROTEAN, 
aus dem Softwarepaket DNAStar, DNASTAR Inc., Madison, WI, USA) wurden zwei 
Peptide ausgewahlt, die mit gewisser Wahrscheinlichkeit eine Immunantwort hervorrufen. 
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Es handelt sich um folgende Peptide, die im Einbuchstabencode fur Aminosauren dargestellt 
sind: 

B: C-K-RAf-Q-L-R-E-L-S-E-A-E-V-R-Q - CONH 2 / Pos. 594 - 608 
5 C: C-Q-E-T-S-P-L-R-D-A-V-V-I-E-Q-S-S-S-L-N-E - CONH 2 / Pos. 781-800 

Die unterstrichenen Cysteine stammen nicht aus der Telomerasesequenz, sondern wurden 
als Linker flir die Kopplung zusatzlich angefligt 

10 Die Peptide wurden uber das Thiol-reaktive Koppiungsreagenz m-Maleimido-benzoyl-N- 
Hydroxysuccinimidester (MBS) an Keyhole Limpet Hemocyanin (KLH) gekoppelt. Damit 
wurden je zwei Kaninchen im Abstand von 2 bis 4 Wochen immunisiert. Vor der 
Immunisierung wurden 5 ml Blut zur Gewinnung von Preimmunseren entnommen. Nach 4 
Immunisierungen wurden ebenfalls 5 ml Blut zur Gewinnung von Immunseren entnommen. 

15 Diese Seren wurden in einem Western-Blot Experiment (Ausubel et al., 1987) auf 
Reaktivitat mit Fusionsproteinen (Beispiel 13) getestet. 

Beispiel 13 

20 Um das Protein der katalytischen Telomerase-Untereinheit analysieren zu konnen, wurden 
bakterielle Expressionversuche durchgefuhrt. 

Die Konstrukte fur diese Experimente sind im Folgenden beschrieben: 

25 Fur das Expressionskonstrukt pMalEST wurde das Insert des in Beispiel 2 erwahnten Klons 
AA281296 mit den Restriktionsenzymen Eco RI und Not I herausgeschnitten, die 
Schnittstellen mit dem Klenow-Fragment aufgefullt (Ausubel et al. t 1987) und in den 
vorgegebenen Leserahmen des Maltose bindenden Proteins des bakteriellen 
Expressionvektors pMAL-C2 (Fa. New England Biolabs) kloniert. Der Vektor pMAL-C2 

30 wurde mit dem Restriktionsenzym Pst I verdaut und die iiberstehenden Einzelstrangenden 
mit der T4 DNA Polymerase entfernt (Ausubel et al. , 1 987). 
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Das Expressionskonstrukt pMalAl beinhaltet die Nukleotidsequenz der Fig. 1 von Position 
1789 bis Position 3908. Dieses DNA-Fragment wurde uber PGR mit den Primern C5A (5'- 
ACCGGAAGAGTGTCTGGAGC AAGTTG-3 ') und C3B (5'- 

GCAC ACCTTTGGTC ACTCCAAATTCC-3 ') aus einer kommerziell erhaltlichen K562 
Marathon-Ready cDNA Library (Fa. Clontech, Katalognuramer 7441-1) amplifiziert und in 
TA-Cloning Vektor pCRII-TOPO der Fa. Invitrogen kloniert. Die PCR-Bedingungen 
wurden wie im Beispiel 7 beschrieben durchgefuhrt Fur das Expressionskonstrukt pMalAl 
wurde das Insert mit dem Restriktionsenzym Eco RI herausgeschnitten, die Schnittstellen 
mit dem Klenow-Fragment aufgeflillt (Ausubel et a/., 1987) und in den mit dem 
Restriktionsenzym Xmn I geschnittenen bakteriellen Expressionvektors pMAL-C2 (Fa. 
New England Biolabs) kloniert. 

Die Proteinexpression unter Venvendung dieser Konstrukte erfolgte in dem Bakterien- 
stamm E. colt DH5cl Die Expressionsbedingungen erfolgten wie in der Betriebsanleitung 
der Fa. New England Biolabs (Katalognummer 800) beschrieben. Die hergestellten bakte- 
riellen Lysate wurden in einem Western-Blot Experiment (Ausubel et ai, 1987) getestet. 

Beispiel 14 

Die bakteriellen Lysate aus Beispiel 13 wurden unter zuhilfenahme der Antiseren aus Bei- 
spiel 12 in einem Western Blot (Ausubel et a/., 1987) analysiert. 

Da der Fusionsanteil fur das Maltose bindende Protein etwa 43 kDa groB ist, werden fur die 
Konstrukte pMalEST und pMalAl Fusionsproteine in der GroBe von etwa 74 kDa bzw 106 
kDa erwartet. . 

Im Vergleich der Pre-Immunseren mit den Seren nach der ersten Immunisierung wird er- 
sichtlich, dafl spezifische Antikorper gegen die Epitope B und C gebildet wurden (Fig. 16). 
Dariiber hinaus wurden neben den erwarteten 74 kDa, bzw. 106 kDa-Proteinen auch 
kleinere Proteinfragmente beobachtet, die mit den Antiseren reagieren. Diese kleineren 
Produkte gehen wahrscheinlich auf vorzeitige zurtick. 
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Auf dem Fusionsprotein aus der Expression mit pMal EST befindet sich nur das Epitop fur 
Serum B. Im Gegensatz dazu befinden sich auf dem Fusionsprotein von pMalAl die 
Epitope der Seren B und C. Aus diesem Grunde erkennt das Antiserum C nicht das 
Expressionsprodukt von pMalEST und lediglich die groBeren Proteinfragmente aus den 
5 Expressionversuchen mit pMalAl. Diese Beobachtung unterstreicht die hohe Spezifitat der 
generierten Antiseren. 

Beispiel 15 

10 Urn das Protein der katalytischen Telomerase-Untereinheit analysieren zu konnen, sollen die 
Proteinkomponente zusammen mit der RNA-Komponente in vitro rekonstituiert werden. 

Die Konstrukte fur diese Experimente sind im folgenden beschrieben: 

15 Die 504 nt lange RNA Komponente (Feng et a/., 1995) wurde mit den Primern HTR9BAM 
(5 , -CGCGGATCCTAATACGACTCACTATAGGGTTGCGGAGGGTGGGCCTG-3 , ) 
und HTR2BAM (5'-CGCGGATCCCGGCGAGGGGTGACGGATGC-3) aus einer 293 
Zell-cDNA-Bibliothek amplifiziert. Der Primer HTR9BAM beinhaltet von Nukleotid 10 bis 
29 einen T7 Promoter. In der PCR wurden in einem Endvolumen von 100 \x\ 3 |il cDNA 

20 aus 293-Zellen mit 10 pmol dNTP-Mix versetzt und in 1 x PCR-Reaktionspuffer mit 0,5 \il 
Taq-Polymerase (Fa. Gibco) eine PCR-Reaktion durchgefiihrt. Je 10 pmol der Primer 
HTR9B AM und HTR2B AM wurden zugefiigt. Die PCR wurde in 3 Schritten durchgefiihrt. 
An eine zehnminutige Denaturierung bei 94°C schlossen sich 35 PCR-Zyklen an, in denen 
die DNA zunachst fur eine Minute bei 94°C denaturiert wurde und anschlieBend fur 2 min 

25 bei 62°C die Primer angelagert und die DNA-Kette verlangert wurde. Zum AbschluB folgte 
fur 4 min eine Kettenverlangerung bei 72°C. Die entstandenen PCR-Produkte wurden nach 
einem Restriktionsverdau mit Bam HI in die Bam Hl-Schnittstelle des Vektor pUC19 
kloniert, so daB die RNA Komponente unter Kontrolle des T7-Promotors steht. Dieses 
Konstrukt wird im folgenden als HTR504 bezeichnet. 

30 

Das 341 1 bp lange cDNA Fragment (Position 60 bis Position 3470, Fig. 1) wurde in den 
Vektor PCRII TOPO (Fa. Invitrogen) kloniert. Detailliertere Angaben zur Klonierung sind 
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in Beispiel 8 und 7, bzw. in Fig. 12 beschrieben. In diesem als HTC FL bezeichneten 
Konstrukt liegt der T7 Promotor 5' vor der hTC cDNA. 

Die Synthese der katalytischen Telomerase-Proteinkomponente erfolgte nach Zugabe des 
hTC FL-Konstruktes in einem kommerziell erhaltlichen Transkriptions/Translation-System 
nach Angaben des Herstellers (Fa. Promega; Katalognummer L4610). Die erfolgreiche in 
vitro Translation des erwarteten 127 kDa Produktes wurde mittels "S-markiertem Cystein 
in einer SDS-PAGE (Ausubel et ai, 1987) kontrolliert (Fig. 17). 

Die Synthese der Telomerase-RNA-Komponente erfolgte mit einem Transkriptions-System 
nach Angaben des Herstellers (Fa. Ambion; Katalognummer 1344) oder nach der von 
Pokrovskaya und Gurevich (1994) beschriebenen Methode. 

Fur die in vitro Rekonstitution wurden 50 ul des oben beschriebenen Translations- Ansatzes 
mit dem hTC FL-Konstrukt mit 0,5 ug hTRNA versetzt und 10 min bei 37°C inkubiert. 2 ul 
dieser Mischung wurden auf ihre enzymatische Aktivitat mit Hilfe des TRAP-Assays unter- 
sucht (N.W. Kim el ai, 1994). Als Positivkontrolle diente eine Aktivitatsmessung nach 
gleicher Methode von aus HeLa-Zellen gereinigter Telomerase (Shay et ai, 1994). Wie in 
Fig. 1 8 zu sehen, erzeugen sowohl das rekonstituierte Enzym als auch das native Enzym das 
gleiche Produktmuster, die fiir die Telomerase charakteristische Nukleotidleiter. Mit diesem 
Ergebnis wurde dariiberhinaus belegt, dafl eine einzige Proteinkomponente zusammen mit 
der RNA fur die enzymatische Telomeraseaktivitat ausreichend ist. 

Zusatzlich zu dem beschriebenen TRAP-Assay wurden 5 ul der Rekonstitutionsmischung 
im direkten Telomerase-Assay (Shay etal., 1994) auf ihre Aktivitat gepriift. Auch in diesem 
Experiment belegt die charakteristische Nukleotidleiter die erfolgreiche Rekonstitution von 
rekombinantem hTC Protein und Telomerase-RNA-Komponente. 

Zusammenfassend konnte hiermit auf funktioneller Ebene gezeigt werden, daB die 
identifizierte und vollstandig klonierte hTC cDNA die katalytische Untereinheit der 
humanen Telomerase darstellt. 
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S EQUEN Z PROTOKOLL 



(1) ALLGEMEINE AM GAB EN: 

(i) ANMELDER: 

(A) NAME: Bayer AG 

(3) STRASSE: Bayerwerk 

(C) ORT: Leverkusen 

(E) LAND: Deutschland 

(F) POSTLEITZAHL: D-S1368 

(G) TELEFON: 0214-303688 

(H) TELEFAX: 0214-303482 

(ii) BEZEICHNUNG DER ERFINDUNG: Humane katalytische Telomerase- 
Untereinheit 

und deren diagnostische und therapeutische Verwendung 

(iii) ANZAHL DER SEQUENZEN: 7 

(iv) COMPUTER-LESBARE FAS SUNG : 

{A) DATENTRDGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS /MS -DOS 

(D) SOFTWARE: Patentln Release H1.0, Version #1.30B (EPA) 



(2) ANGABEN ZU SEQ ID NO: 1: 

(i) SEQUENZKENNZEICHEN : 

(A) LGNGE: 4042 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKsLS: cDNA 

(iii) HYPOTHETISCH : NEIN 

(iv) ANTISENSE: NEIN 

(vi) URSPRsNLICHE HERKUNFT: 

(C) INDIVIDUUM/ISOLAT: Human 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 



GTTTCAGGCA 


GCGCTGCGTC 


CTGCTGCGCA 


CGTGGGAAGC 


CCTGGCCCCG 


GCCACCCCCG 


60 


CGATGCCGCG 


CGCTCCCCGC 


TGCCGAGCCG 


TGCGCTCCCT 


GCTGCGCAGC 


CACTACCGCG 


120 


AGGTGCTGCC 


GCTGGCCACG 


TTCGTGCGGC 


GCCTGGGGCC 


CCAGGGCTGG 


CGGCTGGTGC 


180 


AGCGCGGGGA 


CCCGGCGGCT 


TTCCGCGCGC 


TGGTGGCCCA 


GTGCCTGGTG 


TGCGTGCCCT 


240 


GGGACGCACG 


GCCGCCCCCC 


GCCGCCCCCT 


CCTTCCGCCA 


GGTGTCCTGC 


CTGAAGGAGC 


300 


TGGTGGCCCG 


AGTGCTGCAG 


AGGCTGTGCG 


AGCGCGGCGC 


GAAGAACGTG 


CTGGCCTTCG 


360 


GCTTCGCGCT 


GCTGGACGGG 


GCCCGCGGGG 


GCCCCCCCGA 


GGCCTTCACC 


ACCAGCGTGC 


420 
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GCAGCTACCT GCCCAACACG GTGACCGACG CACTGCGGGG GAGCGGGGCG TGGGGGCTGC 4 80 

TGCTGCGCCG CGTGGGCGAC GACGTGCTGG TTCACCTGCT GGCACGCTGC GCGCTCTTTG 54 0 

TGCTGGTGGC TCCCAGCTGC GCCTACCAGG TGTGCGGGCC GCCGCTGTAC CAGCTCGGCG 600 

CTGCCACTCA GGCCCGGCCC CCGCCACACG CTAGTGGACC CCGAAGGCGT CTGGGATGCG 660 

AACGGGCCTG GAACCATAGC GTCAGGGAGG CCGGGGTCCC CCTGGGCCTG CCAGCCCCGG 720 

GTGCGAGGAG GCGCGGGGGC AGTGCCAGCC GAAGTCTGCC GTTGCCCAAG AGGCCCAGGC 780 

GTGGCGCTGC CCCTGAGCCG GAGCGGACGC CCGTTGGGCA GGGGTCCTGG GCCCACCCGG 840 

GCAGGACGCG TGGACCGAGT GACCGTGGTT TCTGTGTGGT GTCACCTGCC AGACCCGCCG 900 

AAGAAGCCAC CTCTTTGGAG GGTGCGCTCT CTGGCACGCG CCACTCCCAC CCATCCGTGG 9 60 

GCCGCCAGCA CCACGCGGGC CCCCCATCCA CATCGCGGCC ACCACGTCCC TGGGACACGC 1020 

CTTGTCCCCC GGTGTACGCC GAGACCAAGC ACTTCCTCTA CTCCTCAGGC GACAAGGAGC 1080 

AGCTGCGGCC CTCCTTCCTA CTCAGCTCTC TGAGGCCCAG CCTGACTGGC GCTCGGAGGC 1140 

TCGTGGAGAC CATCTTTCTG GGTTCCAGGC CCTGGATGCC AGGGACTCCC CGCAGGTTGC 1200 

CCCGCCTGCC CCAGCGCTAC TGGCAAATGC GGCCCCTGTT TCTGGAGCTG CTTGGGAACC 12 60 

ACGCGCAGTG CCCCTACGGG GTGCTCCTCA AGACGCACTG CCCGCTGCGA GCTGCGGTCA 1320 

CCCCAGCAGC CGGTGTCTGT GCCCGGGAGA AGCCCCAGGG CTCTGTGGCG GCCCCCGAGG 1380 

AGGAGGACAC AGACCCCCGT CGCCTGGTGC AGCTGCTCCG CCAGCACAGC AGCCCCTGGC 14 40 

AGGTGTACGG CTTCGTGCGG GCCTGCCTGC GCCGGCTGGT GCCCCCAGGC CTCTGGGGCT 1500 

CCAGGCACAA CGAACGCCGC TTCCTCAGGA ACACCAAGAA GTTCATCTCC CTGGGGAAGC 1560 

ATGCCAAGCT CTCGCTGCAG GAGCTGACGT GGAAGATGAG CGTGCGGGAC TGCGCTTGGC 1620 

TGCGCAGGAG CCCAGGGGTT GGCTGTGTTC CGGCCGCAGA GCACCGTCTG CGTGAGGAGA 1680 

TCCTGGCCAA GTTCCTGCAC TGGCTGATGA GTGTGTACGT CGTCGAGCTG CTCAGGTCTT 17 4 0 

TCTTTTATGT CACGGAGACC ACGTTTCAAA AGAACAGGCT CTTTTTCTAC CGGAAGAGTG 18 00 

TCTGGAGCAA GTTGCAAAGC ATTGGAATCA GACAGCACTT GAAGAGGGTG CAGCTGCGGG 18 60 

AGCTGTCGGA AGCAGAGGTC AGGCAGCATC GGGAAGCCAG GCCCGCCCTG CTGACGTCCA 1920 

GACTCCGCTT CATCCCCAAG CCTGACGGGC TGCGGCCGAT TGTGAACATG GACTACGTCG 1930 

TGGGAGCCAG AACGTTCCGC AGAGAAAAGA GGGCCGAGCG TCTCACCTCG AGGGTGAAGG 204 0 

CACTGTTCAG CGTGCTCAAC TACGAGCGGG CGCGGCGCCC CGGCCTCCTG GGCGCCTCTG 2100 

TGCTGGGCCT GGACGATATC CACAGGGCCT GGCGCACCTT CGTGCTGCGT GTGCGGGCCC 2160 

AGGACCCGCC GCCTGAGCTG TACTTTGTCA AGGTGGATGT GACGGGCGCG TACGACACCA 2220 
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(2) AN GAB EN ZU SEQ ID NO: 2: 

(i) SEQUENZKENNZEICHEN: 

{A) LQNGE: 1132 Aminos„uren 

(B) ART: Aminos„ure 

(C) ST RANG FORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKsLS: Protein 

(iii) HYPOTHETISCH: NEIN 

(iv) ANTISENSE: NEIN 

(vi) URSPRsNLICHE HERKUNFT: 

(C) INDIVIDUUM/ISOLAT: Human 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 

Met Pro Arg Ala Pro Arg Cys Arg Ala Val Arg Ser Leu Leu Arg Ser 
1 5 10 15 

His Tyr Arg Glu Val Leu Pro Leu Ala Thr Phe Val Arg Arg Leu Gly 
20 25 30 

Pro Gin Gly Trp Arg Leu Val Gin Arg Gly Asp Pro Ala Ala Phe Arg 
35 40 45 

Ala Leu Val Ala Gin Cys Leu Val Cys Val Pro Trp Asp Ala Arg Pro 
50 55 60 

Pro Pro Ala Ala Pro Ser Phe Arg Gin Val Ser Cys Leu Lys Glu Leu 
65 70 75 80 

Val Ala Arg Val Leu Gin Arg Leu Cys Glu Arg Gly Ala Lys Asn Val 
85 90 95 

Leu Ala Phe Gly Phe Ala Leu Leu Asp Gly Ala Arg Gly Glv Pro Pro 
100 105 no 

Glu Ala Phe Thr Thr Ser Val Arg Ser Tyr Leu Pro Asn Thr Val Thr 
115 120 125 

Asp Ala Leu Arg Gly Ser Gly Ala Trp Gly Leu Leu Leu Arg Arg Val 
130 135 140 

Gly Asp Asp Val Leu Val His Leu Leu Ala Arg Cys Ala Leu Phe Val 
145 150 155 160 

Leu Val Ala Pro Ser Cys Ala Tyr Gin Val Cys Gly Pro Pro Leu Tyr 
165 170 175 

Gin Leu Gly Ala Ala Thr Gin Ala Arg Pro Pro Pro His Ala Ser Gly 
180 185 190 

Pro Arg Arg Arg Leu Gly Cys Glu Arg Ala Trp Asn His Ser Val Arg 
195 200 205 

Glu Ala Gly Val Pro Leu Gly Leu Pro Ala Pro Gly Ala Arg Arg Arg 
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210 



215 



220 



Gly Gly Ser Ala Ser Arg Ser Leu Pro Leu Pro Lys Arg Pro Arg Arg 
225 230 235 240 

Gly Ala Ala Pro Glu Pro Glu Arg Thr Pro Val Gly Gin Gly Ser Trp 
245 250 255 

Ala His Pro Gly Arg Thr Arg Gly Pro Ser Asp Arg Gly Phe Cys Val 
260 265 270 

Val Ser Pro Ala Arg Pro Ala Glu Glu Ala Thr Ser Leu Glu Gly Ala 
275 280 285 

Leu Ser Gly Thr Arg His Ser His Pro Ser Val Gly Arg Gin His His 
290 295 300 

Ala Gly Pro Pro Ser Thr Ser Arg Pro Pro Arg Pro Trp Asp Thr Pro 
305 310 315 320 

Cys Pro Pro Val Tyr Ala Glu Thr Lys His Phe Leu Tyr Ser Ser Gly 
325 330 335 

Asp Lys Glu Gin Leu Arg Pro Ser Phe Leu Leu Ser Ser Leu Arg Pro 
340 345 350 

Ser Leu Thr Gly Ala Arg Arg Leu Val Glu Thr lie Phe Leu Gly Ser 
355 360 365 

Arg Pro Trp Met Pro Gly Thr Pro Arg Arg Leu Pro Arg Leu Pro Gin 
370 375 380 

Arg Tyr Trp Gin Met Arg Pro Leu Phe Leu Glu Leu Leu Gly Asn His 
385 390 395 400 

Ala Gin Cys Pro Tyr Gly Val Leu Leu Lys Thr His Cys Pro Leu Arg 
405 410 415 

Ala Ala Val Thr Pro Ala Ala Gly Val Cys Ala Arg Glu Lys Pro Gin 
420 425 430 

Gly Ser Val Ala Ala Pro Glu Glu Glu Asp Thr Asp Pro Arg Arg Leu 
435 440 445 

Val Gin Leu Leu Arg Gin His Ser Ser Pro Trp Gin Val Tyr Gly Phe 
450 455 460 

Val Arg Ala Cys Leu Arg Arg Leu Val Pro Pro Gly Leu Trp Gly Ser 
465 470 475 480 

Arg His Asn Glu Arg Arg Phe Leu Arg Asn Thr Lys Lys Phe lie Ser 
435 490 495 

Leu Gly Lys His Ala Lys Leu Ser Leu Gin Glu Leu Thr Trp Lys Met 
500 505 510 

Ser Val Arg Asp Cys Ala Trp Leu Arg Arg Ser Pro Gly Val Gly Cys 
515 520 525 



Val Pro Ala Ala Glu His Arg Leu Arg Glu Glu lie Leu Ala Lys Phe 
530 535 540 
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Leu His Trp Leu Met Ser Val Tyr Val Val Glu Leu Leu Arg Ser Phe 
545 550 555 560 

Phe Tyr Val Thr Glu Thr Thr Phe Gin Lys Asn Arg Leu Phe Phe Tyr 
565 570 575 

Arg Lys Ser Val Trp Ser Lys Leu Gin Ser lie Gly lie Arg Gin His 
580 585 590 

Leu Lys Arg Val Gin Leu Arg Glu Leu Ser Glu Ala Glu Val Arg Gin 
595 600 605 

His Arg Glu Ala Arg Pro Ala Leu Leu Thr Ser Arg Leu Arg Phe lie 
610 615 620 

Pro Lys Pro Asp Gly Leu Arg Pro lie Val Asn Met Asp Tyr Val Val 
625 630 635 640 

Gly Ala Arg Thr Phe Arg Arg Glu Lys Arg Ala Glu Arg Leu Thr Ser 
645 650 655 

Arg Val Lys Ala Leu Phe Ser Val Leu Asn Tyr Glu Arg Ala Arg Arg 
660 665 670 

Pro Gly Leu Leu Gly Ala Ser Val Leu Gly Leu Asp Asp lie His Arg 
675 680 685 

Ala Trp Arg Thr Phe Val Leu Arg Val Arg Ala Gin Asp Pro Pro Pro 
690 695 700 

Glii Leu Tyr Phe Val Lys Val Asp Val Thr Gly Ala Tyr Asp Thr lie 
705 710 715 720 

Pro Gin Asp Arg Leu Thr Glu Val He Ala Ser He He Lys Pro Gin 
725 730 735 

Asn Thr Tyr Cys Val Arg Arg Tyr Ala Val Val Gin Lys Ala Ala His 
740 745 750 

Gly His Val Arg Lys Ala Phe Lys Ser His Val Ser Thr Leu Thr Asp 
755 760 765 

Leu Gin Pro Tyr Met Arg Gin Phe Val Ala His Leu Gin Glu Thr Ser 
770 775 780 

Pro Leu Arg Asp Ala Val Val He Glu Gin Ser Ser Ser Leu Asn Glu 
785 790 795 800 

Ala Ser Ser Gly Leu Phe Asp Val Phe Leu Arg Phe Met Cys His His 
805 810 815 

Ala Val Arg He Arg Gly Lys Ser Tyr Val Gin Cys Gin Gly He Pro 
820 825 830 

Gin Gly Ser lie Leu Ser Thr Leu Leu Cys Ser Leu Cys Tyr Gly Asp 
835 840 845 



Met Glu Asn Lys Leu Phe Ala Gly He Arg Arg Asp Gly Leu Leu Leu 
850 855 860 
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Arg Leu Val Asp Asp ?he Leu Leu Val Thr Pro His Leu Thr His Aia 
865 870 875 880 

Lys Thr Phe Leu Arg Thr Leu Val Arg Gly Val Pro Glu Tyr Gly Cys 
885 890 395 

Val Val Asn Leu Arg Lys Thr Val Val Asn Phe Pro Val Glu Asp Glu 
900 905 910 

Ala Leu Gly Gly Thr Ala Phe Val Gin Met Pro Ala His Gly Leu Phe 
915 920 925 

Pro Trp Cys Gly Leu Leu Leu Asp Thr Arg Thr Leu Glu Val Gin Ser 
930 935 940 

Asp Tyr Ser Ser Tyr Ala Arg Thr Ser He Arg Ala Ser Leu Thr Phe 
945 950 955 960 

Asn Arg Gly Phe Lys Ala Gly Arg Asn Met Arg Arg Lys Leu Phe Gly 
965 970 975 

Val Leu Arg Leu Lys Cys His Ser Leu Phe Leu Asp Leu Gin Val Asn 
980 985 990 

Ser Leu Gin Thr Val Cys Thr Asn He Tyr Lys He Leu Leu Leu Gin 
995 1000 1005 

Ala Tyr Arg Phe His Ala Cys Val Leu Gin Leu Pro Phe His Gin Gin 
1010 1015 1020 

Val Trp Lys Asn Pro Thr Phe Phe Leu Arg Val He Ser Asp Thr Ala 
1025 1030 1035 1040 

Ser Leu Cys Tyr Ser He Leu Lys Ala Lys Asn Ala Gly Met Ser Leu 
1045 1050 1055 

Gly Ala Lys Gly Ala Ala Gly Pro Leu Pro Ser Glu Ala Val Gin Trp 
1060 1065 1070 

Leu Cys His Gin Ala Phe Leu Leu Lys Leu Thr Arg His Arg Val Thr 
1075 1080 1085 

Tyr Val Pro Leu Leu Gly Ser Leu Arg Thr Ala Gin Thr Gin Leu Ser 
1090 1095 HOO 

Arg Lys Leu Pro Gly Thr Thr Leu Thr Ala Leu Glu Ala Ala Ala Asn 
1105 1110 1H5 1120 

Pro Ala Leu Pro Ser Asp Phe Lys Thr He Leu Asp 
1125 1130 

(2) AN GAB EN ZU SEQ ID NO: 3: 

(i) SEQUENZ KENNZEICHEN : 

(A) LONGE: 1153 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii> ART DES MOLEKsLS: cDNA 
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(iii) HYPOTHETI SCH : NEIN 

(iv) ANTISENSE: NEIN 

(vi) URSPRsNLICHE HERKUNFT: 

(C) INDIVIDUUM/ISOLAT: Human 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 

GTGCCTGCAG AGACCCGTCT GGTGCACTCT GATTCTCCAC TTGCCTGTTG CATGTCCTCG 60 

TTCCCTTGTT TCTCACCACC TCTTGGGTTG CCATGTGCGT TTCCTGCCGA GTGTGTGTTG 120 

ATCCTCTCGT TGCCTCCTGG TCACTGGGCA TTTGCTTTTA TTTCTCTTTG CTTAGTGTTA 180 

CCCCCTGATC TTTTTATTGT CGTTGTTTGC TTTTGTTTAT TGAGACAGTC TCACTCTGTC 240 

ACCCAGGCTG GAGTGTAATG GCACAATCTC GGCTCACTGC AACCTCTGCC TCCTCGGTTC 300 

AAGCAGTTCT CATTCCTCAA CCTCATGAGT AGCTGGGATT ACAGGCGCCC ACCACCACGC 360 

CTGGCTAATT TTTGTATTTT TAGTAGAGAT AGGCTTTCAC CATGTTGGCC AGGCTGGTCT 420 

CAAACTCCTG ACCTCAAGTG ATCTGCCCGC CTTGGCCTCC CACAGTGCTG GGATTACAGG 4 80 

TGCAAGCCAC CGTGCCCGGC ATACCTTGAT CTTTTAAAAT GAAGTCTGAA ACATTGCTAC 540 

CCTTGTCCTG AGCAATAAGA CCCTTAGTGT ATTTTAGCTC TGGCCACCCC CCAGCCTGTG 600 

TGCTGTTTTC CCTGCTGACT TAGTTCTATC TCAGGCATCT TGACACCCCC ACAAGCTAAG 660 

CATTATTAAT ATTGTTTTCC GTGTTGAGTG TTTCTTTAGC TTTGCCCCCG CCCTGCTTTT 720 

CCTCCTTTGT TCCCCGTCTG TCTTCTGTCT CAGGCCCGCC GTCTGGGGTC CCCTTCCTTG 780 

TCCTTTGCGT GGTTCTTCTG TCTTGTTATT GCTGGTAAAC CCCAGCTTTA CCTGTGCTGG 840 

CCTCCATGGC ATCTAGCGAC GTCCGGGGAC CTCTGCTtAT GATGCACAGA TGAAGATGTG 900 

GAGACTCACG AGGAGGGCGG TCATCTTGGC CCGTGAGTGT CTGGAGCACC ACGTGGCCAG 960 

CGTTCCTTAG CCAGGGTTGG CTGTGTTCCG GCCGCAGAGC ACCGTCTGCG TGAGGAGATC 1020 

CTGGCCAAGT TCCTGCACTG GCTGATGAGT GTGTACGTCG TCGAGCTGCT CAGGTCTTTC 1080 

TTTTATGTCA CGGAGACCAC GTTTCAAAAG AACAGGCTCT TTTTCTACCG GAAGAGTGTC 1140 

TGGAGCAAGT TGC 1153 
(2) ANGABEN ZU SEQ ID NO: 4: 

( i } SEQUENZKENNZEICHEN : 

(A) LONGE: 412 Basenpaare 

(B) ART: Nucleotid 

(C) ST RANG FORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKsLS: cDNA 
(iii) HYPOTHETISCH: NEIN 
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(iv) ANTISENSE: NEIN 

(vi) URSPRsNLICHE HERKUNFT: 

(C) INDIVIDUUM/ISOLAT: Human 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 

CAGAGCCCTG GTCCTCCTGT CTCCATCGTC ACGTGGGCAC ACGTGGCTTT TCGCTCAGGA 60 

CGTCGAGTGG ACACGGTGAT CTCTGCCTCT GCTCTCCCTC CTGTCCAGTT TGCATAAACT 120 

TACGAGGTTC ACCTTCACGT TTTGATGGAC ACGCGGTTTC CAGGCACCGA GGCCAGAGCA 180 

GTGAACAGAG GAGGCTGGGC GCGGCAGTGG AGCCGGGTTG CCGGCAATGG GGAGAAGTGT 240 

CTGGAAGCAC AGACGCTCTG GCGAGGGTGC CTGCAGAGAC CCGCCTGGTG CACTCTGATT 300 

CTCCACTTGC CTGTTGCATG TCCTCGTTCC CTTGTTTCTC ACCACCTCTT GGGTTGCCAT 360 

GTGCGTTTCC TGCCGAGTGT GTGTTGATCC TCTCGTTGCC TCCTGGTCAC TG 412 
(2i AN GAB EN ZU SEQ ID NO: 5: 

(i) SEQUENZKENNZEICHEN: 

(A) LONGE : 1012 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKsLS: cDNA 

(iii) HYPOTKETISCH: NEIN 

(iv) ANTISENSE: NEIN 

(vi) URSPRsNLICHE HERKUNFT : 

(C) INDIVIDUUM/ISOLAT: Human 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5: 

GGGGTCCTGG GCCCACCCGG GCAGGACGCG TGGACCGAGT GACCGTGGTT TCTGTGTGGT 60 

GTCACCTGCC AGACCCGCCG AAGAAGCCAC CTCTTTGGAG GGTGCGCTCT CTGGCACGCG 120 

CCACTCCCAC CCATCCGTGG GCCGCCAGCA CCACGCGGGC CCCCCATCCA CATCGCGGCC 180 

ACCACGTCCC TGGGACACGC CTTGTCCCCC GGTGTACGCC GAGACCAAGC ACTTCCTCTA 24 0 

CTCCTCAGGC GACAAGGAGC AGCTGCGGCC CTCCTTCCTA CTCAGCTCTC TGAGGCCCAG 300 

CCTGACTGGC GCTCGGAGGC TCGTGGAGAC CATCTTTCTG GGTTCCAGGC CCT GGATGCC 360 

AGGGACTCCC CGCAGGTTGC CCCGCCTGCC CCAGCGCTAC TGGCAAATGC GGCCCCTGTT 420 

TCTGGAGCTG CTTGGGAACC ACGCGCAGTG CCCCTACGGG GTGCTCCTCA AGACGCACTG 4 80 

CCCGCTGCGA GCTGCGGTCA CCCCAGCAGC CGGTGTCTGT GCCCGGGAGA AGCCCCAGGG 540 
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CTCTGTGGCG GCCCCCGAGG AGGAGGACAC AGACCCCCGT CGCCTGGTGC AGCTGCTCCG 600 

CCAGCACAGC AGCCCCTGGC AGGTGTACGG CTTCGTGCGG GCCTGCCTGC GCCGGCTGGT 660 

GCCCCCAGGC CTCTGGGGCT CCAGGCACAA CGAACGCCGC TTCCTCAGGA ACACCAAGAA 720 

GTTCATCTCC CTGGGGAAGC ATGCCAAGCT CTCGCTGCAG GAGCTGACGT GGAAGATGAG 7 80 

CGTGCGGGAC TGCGCTTGGC TGCGCAGGAG CCCAGGTGAG GAGGTGGTGG CCGTCGAGGG 84 0 

CCCAGGCCCC AGAGCTGAAT GCAGTAGGGG CTCAGAAAAG GGGGCAGGCA GAGCCCTGGT 900 

CCTCCTGTCT CCATCGTCAC GTGGGCACAC GTGGCTTTTC GCTCAGGACG TCGAGTGGAC 960 

ACGGTGATCT CTGCCTCTGC TCTCCCTCCT GTCCAGTTTG CATAAACTTA CG 1012 
(2) AN GAB EN ZU SEQ ID NO: 6: 

(i) SEQUENZKENNZEICHEN: 

(A) LDNGE: 3972 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGfORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKsLS: cDNA 

(iii) HYPOTHETISCH: NEIN 

(iv) ANTI SENSE: NEIN 

(vi) URSPRsNLICHE HERKUNFT: 

(C) INDIVIDUUM/ISOLAT: Human 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 

GAATTCGCGG CCGCGTCGAC GTTTCAGGCA GCGCTGCGTC CTGCTGCGCA CGTGGGAAGC 60 

CCTGGCCCCG GCCACCCCCG CGATGCCGCG CGCTCCCCGC TGCCGAGCCG TGCGCTCCCT 120 

GCTGCGCAGC CACTACCGCG AGGTGCTGCC GCTGGCCACG TTCGTGCGGC GCCTGGGGCC 180 

CCAGGGCTGG CGGCTGGTGC AGCGCGGGGA CCCGGCGGCT TTCCGCGCGC TGGTGGCCCA 240 

GTGCCTGGTG TGCGTGCCCT GGGACGCACG GCCGCCCCCC GCCGCCCCCT CCTTCCGCCA 300 

GGTGTCCTGC CTGAAGGAGC TGGTGGCCCG AGTGCTGCAG AGGCTGTGCG AGCGCGGCGC 360 

' GAAGAACGTG CTGGCCTTCG GCTTCGCGCT GCTGGACGGG GCCCGCGGGG GCCCCCCCGA 420 

GGCCTTCACC ACCAGCGTGC GCAGCTACCT GCCCAACACG GTGACCGACG CACTGCGGGG 480 

GAGCGGGGCG TGGGGGCTGC TGCTGCGCCG CGTGGGCGAC GACGTGCTGG TTCACCTGCT 54 0 

GGCACGCTGC GCGCTCTTTG TGCTGGTGGC TCCCAGCTGC GCCTACCAGG TGTGCGGGCC 600 

GCCGCTGTAC CAGCTCGGCG CTGCCACTCA GGCCCGGCCC CCGCCACACG CTAGTGGACC 660 

CCGAAGGCGT CTGGGATGCG AACGGGCCTG GAACCATAGC GTCAGGGAGG CCGGGGTCCC 720 
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CCTGGGCCTG CCAGCCCCGG GTGCGAGGAG GCGCGGGGGC AGTGCCAGCC GAAGTCTGCC 780 

GTTGCCCAAG AGGCCCAGGC GTGGCGCTGC CCCTGAGCCG GAGCGGACGC CCGTTGGGCA 84 0 

GGGGTCCTGG GCCCACCCGG GCAGGACGCG TGGACCGAGT GACCGTGGTT TCTGTGTGGT 900 

GTCACCTGCC AGACCCGCCG AAGAAGCCAC CTCTTTGGAG GGTGCGCTCT CTGGCACGCG 960 

CCACTCCCAC CCATCCGTGG GCCGCCAGCA CCACGCGGGC CCCCCATCCA CATCGCGGCC 1020 

ACCACGTCCC TGGGACACGC CTTGTCCCCC GGTGTACGCC GAGACCAAGC ACTTCCTCTA 108 0 

CTCCTCAGGC GACAAGGAGC AGCTGCGGCC CTCCTTCCTA CTCAGCTCTC TGAGGCCCAG 1140 

CCTGACTGGC GCTCGGAGGC TCGTGGAGAC CATCTTTCTG GGTTCCAGGC CCTGGATGCC 1200 

AGGGACTCCC CGCAGGTTGC CCCGCCTGCC CCAGCGCTAC TGGCAAATGC GGCCCCTGTT 1260 

TCTGGAGCTG CTTGGGAACC ACGCGCAGTG CCCCTACGGG GTGCTCCTCA AGACGCACTG 1320 

CCCGCTGCGA GCTGCGGTCA CCCCAGCAGC CGGTGTCTGT GCCCGGGAGA AGCCCCAGGG 1380 

CTCTGTGGCG GCCCCCGAGG AGGAGGACAC AGACCCCCGT CGCCTGGTGC AGCTGCTCCG 14 40 

CCAGCACAGC AGCCCCTGGC AGGTGTACGG CTTCGTGCGG GCCTGCCTGC GCCGGCTGGT 1500 

GCCCCCAGGC CTCTGGGGCT CCAGGCACAA CGAACGCCGC TTCCTCAGGA ACACCAAGAA 1560 

GTTCATCTCC CTGGGGAAGC ATGCCAAGCT CTCGCTGCAG GAGCTGACGT GGAAGATGAG 1620 

CGTGCGGGAC TGCGCTTGGC TGCGCAGGAG CCCAGGTGAG GAGGTGGTGG CCGTCGAGGG 1680 

CCCAGGCCCC AGAGCTGAAT GCAGTAGGGG CTCAGAAAAG GGGGCAGGCA GAGCCCTGGT 1740 

CCTCCTGTCT CCATCGTCAC GTGGGCACAC GTGGCTTTTC GCTCAGGACG TCGAGTGGAC 1800 

ACGGTGATCT CTGCCTCTGC TCTCCCTCCT GTCCAGTTTG CATAAACTTA CGAGGTTCAC 18 60 

CTTCACGTTT TGATGGACAC GCGGTTTCCA GGCGCCGAGG CCAGAGCAGT GAACAGAGGA 1920 

GGCTGGGCGC GGCAGTGGAG CCGGGTTGCC GGCAATGGGG AGAAGTGTCT GGAAGCACAG 1980 

ACGCTCTGGC GAGGGTGCCT GCAGGGGTTG GCTGTGTTCC GGCCGCAGAG CACCGTCTGC 2040 

GTGAGGAGAT CCTGGCCAAG TTCCTGCACT GGCTGATGAG TGTGTACGTC GTCGAGCTGC 2100 

TCAGGTCTTT CTTTTATGTC ACGGAGACCA CGTTTCAAAA GAACAGGCTC TTTTTCTACC 2160 

GGAAGAGTGT CTGGAGCAAG TTGCAAAGCA TTGGAATCAG ACAGCACTTG AAGAGGGTGC 2220 

AGCTGCGGGA GCTGTCGGAA GCAGAGGTCA GGCAGCATCG GGAAGCCAGG CCCGCCCTGC 22 80 

TGACGTCCAG ACTCCGCTTC ATCCCCAAGC CTGACGGGCT GCGGCCGATT GTGAACATGG 23 40 

ACTACGTCGT GGGAGCCAGA ACGTTCCGCA GAGAAAAGAG GGTGGCTGTG CTTTGGTTTA 24 00 

ACTTCCTTTT TAAACAGAAG TGCGTTTGAG CCCCACATTT GGTATCAGCT TAGATGAAGG 24 60 

GCCCGGAGGA GGGGCCACGG GACACAGCCA GGGCCATGGC ACGGCGCCAA CCCATTTGTG 2520 
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CGCACGGTGA GGTGGCCGAG GTGCCGGTGC CTCCAGAAAA GCAGCGTGGG GGTGTAGGGG 2580 

GAGCTCCTGG GGCAGGGACA GGCTCTGAGG ACCACAAGAA GCAGCTGGGC CAGGGCCTGG 2640 

ATGCAGCACG GCCCGAGCGG GTGGGGGCCC ACCACGCCAT TCTGGTCAAA GGTGTTGTAG 2700 

TCGTAATAGC CGGCCCAGGC GCTCTGAACC TTCAGAGTCT CAAAAGCTGG GACCCTCAGG 27 60 

GCCAAATGGG GCCACACCTT GTCCTGGAAG AAATCATGGT CCACTTCCAG GTTCGCCGGG 2820 

TCCGGTTCTT CCTGCTCAGT GGGGCTACGA CCACCTAGGT AGTTGCTACC TAATCCTTCC 2880 

CGGCGAAAAT AGGCTCCACT GGTGTCTGCA ACAAGCGGAG TCTCTAGGCC TGGTCCCTGG 2940 

GGG CAGTGCC ACACATACAC ATACCTTTTC CTCGGCTCCA CAGGTAGCTT GGTGCCCTGC 3000 

AGGGTGCCAG GCGGCCCCTC TCCAACACCA GCCAGTGCTG CGATTTGCGC AGACCAGGCT 3060 

CCGGCTGCGT TGATCACAAT GGCGCATTCC ACAGGCTGGT ACTCCAGGCT GCGGTCCATC 3120 

TTCACATGGA CTTCATGGAT CCTTTTCAAG ACCACCGCTT TGTCATCTGT GGTCAACATG 3180 

CGTTGAGATG AAGAGACAAA ACGTGTCACC TCTCCCTGGC AGAAAAGGAC TCCCAAGGAC 324 0 

TGGACCTTTC GCCGAAGCCC CTGGAGCAGA CACCAGGGGT CAAACCAACC TTCGTCCTCC 3300 

ATCCCATAAG ACGCCAAAGC CACTCCCTCT GTGTTTATCC AGGGAAACTT GTTCCGAAGC 3360 

TGATCAGGAG ACATCAGAGA AACTTTGGCT CCCTCCTGCC TCTGCACTTT CACGTTGCTC 3420 

TCCATGGCTG CAGCATCCTT TTCTGAAGCC AGCAAGAGGT AGCCCGAGGG GTTGAACCGG 3480 

AGGTCCAGGG GAGGAGCATC GACT AC GGCC AGGTACTCAT TGATGTTCCG TAGAAAGCTG 3540 

GCTGAAAAGA GGGAGAGCTG GATGTTCTCA GGCAATGAGA ACTGCTGACA AATCCCACCT 3 600 

ACTGAGAGCC CAGTGGAGGC CTGTGAATAC GTGTGGTCCC GTTCCACCAC TAGCACTCGA 3 660 

ATAGCACCTC GTCTGCTCTC CAGCTTCTTC AGCCAATAGG CCACAGACAA GCCAAGCACC 3720 

CCACCTCCCA CGATCACCAC ATCCGAGTGC TCGGGAGGCA GGTGGCTGGT GTCTTGCAGT 3780 

AGATCACAGG ACCTTCCAGG CAGGATCGAC TTGATCTTCT TCTTAATCTC AGACACCTTT 3840 

CCATCCCAGT CCAGAGAAAA GCCTCCTCTG CGCGTGCCTG GCCTCCGGGT CAAGAGGCCC 3900 

CGGCCCATGC CGTGCGGCAG AACCCTCCGA ATCATAGCCC CTCTGAGCCC GGGTCGACGC 3960 

GGCCGCGAAT TC 3972 
(2) AN GAB EN ZU SEQ ID NO: 7: 

(i) SEQUENZKENNZEICHEN: 

(A) LQNGE: 2089 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKsLS: cDNA 
(v) ART DES FRAGMENTS: linear 
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(vi) URSPRsNLICHE HERKUNET: 

(C) INDIVIDUUM/ISOLAT: Human 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 7: 
CCGGAAGAGT GTCTGGAGCA AGTTGCAAAG CATTGGAATC AGACAGCACT TGAAGAGGGT 60 

GCAGCTGCGG GAGCTGTCGG AAGCAGAGGT CAGGCAGCAT CGGGAAGCCA GGCCCGCCCT 120 

GCTGACGTCC AGACTCCGCT TCATCCCCAA GCCTGACGGG CTGCGGCCGA TTGTGAACAT 180 

GGACTACGTC GTGGGAGCCA GAACGTTCCG CAGAGAAAAG AGGGCCGAGC GTCTCACCTC 240 

GAGGGTGAAG GCACTGTTCA GCGTGCTCAA CTACGAGCGG GCGCGGCGCC CCGGCCTCCT 300 

GGGCGCCTCT GTGCTGGGCC TGGACGATAT CCACAGGGCC TGGCGCACCT TCGTGCTGCG 360 

TGTGCGGGCC CAGGACCCGC CGCCTGAGCT GTACTTTGTC AAGGTGGATG TGACGGGCGC 4 20 

GTACGACACC ATCCCCCAGG ACAGGCTCAC GGAGGTCATC GCCAGCATCA TCAAACCCCA 4 80 

GAACACGTAC TGCGTGCGTC GGTATGCCGT GGTCCAGAAG GCCGCCCATG GGCACGTCCG 54 0 

CAAGGCCTTC AAGAGCCACG TCTCTACCTT GACAGACCTC CAGCCGTACA TGCGACAGTT 600 

CGTGGCTCAC CTGCAGGAGA CCAGCCCGCT GAGGGGTGCC GTCGTCATCG AGCAGAGCTC 660 

CTCCCTGAAT GAGGCCAGCA GTGGCCTCTT CGACGTCTTC CTACGCTTCA TGTGCCACCA 720 

CGCCGTGCGC ATCAGGGGCA AGTCCTACGT CCAGTGCCAG GGGATCCCGC AGGGCTCCAT 780 

CCTCTCCACG CTGCTCTGCA GCCTGTGCTA CGGCGACATG GAGAACAAGC TGTTTGCGGG 840 

GATTCGGCGG GACGGGCTGC TCCTGCGTTT GGTGGATGAT TTCTTGTTGG TGACACCTCA 900 

CCTCACCCAC GCGAAAACCT TCCTCAGGAC CCTGGTCCGA GGTGTCCCTG AGTATGGCTG 960 

CGTGGTGAAC TTGCGGAAGA CAGTGGTGAA CTTCCCTGTA GAAGACGAGG CCCTGGGTGG 1020 

CACGGCTTTT GTTCAGATGC CGGCCCACGG CCTATTCCCC TGGTGCGGCC TGCTGCTGGA 1080 

TACCCGGACC CTGGAGGTGC AGAGCGACTA CTCCAGCTAT GCCCGGACCT CCATCAGAGC 1140 

CAGTCTCACC TTCAACCGCG GCTTCAAGGC TGGGAGGAAC ATGCGTCGCA AACTCTTTGG 1200 

GGTCTTGCGG CTGAAGTGTC ACAGCCTGTT TCTGGATTTG CAGGTGAACA GCCTCCAGAC 1260 

GGTGTGCACC AACATCTACA AGATCCTCCT GCTGCAGGCG TACAGGTTTC ACGCATGCGT 1320 

GCTGCAGCTC CCATTTCATC AGCAAGTTTG GAAGAACCCC ACATTTTTCC TGCGCGTCAT 1380 

CTCTGACACG GCCTCCCTCT GCTACTCCAT CCTGAAAGCC AAGAACGCAG GTATGTGCAG 1440 

GTGCCTGGCC TCAGTGGCAG CAGTGCCTGC CTGCTGGTGT TAGTGTGTCA GGAGACTGAG 1500 

TGAATCTGGG CTTAGGAAGT TCTTACCCCT TTTCGCATCA GGAAGTGGTT TAACCCAACC 1560 

ACTGTCAGGC TCGTCTGCCC GCCCTCTCGT GGGGTGAGCA GAGCACCTGA TGGAAGGGAC 1620 
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AGGAGCTGTC TGGGAGCTGC CATCCTTCCC ACCTTGCTCT GCCTGGGGAA GCGCTGGGGG 1630 

GCCTGGTCTC TCCTGTTTGC CCCATGGTGG GATTTGGGGG GCCTGGCCTC TCCTGTTTGC 1740 

CCTGTGGTGG GATTGGGCTG TCTCCCGTCC ATGGCACTTA GGGCCCTTGT GCAAACCCAG 1800 

GCCAAGGGCT TAGGAGGAGG CCAGGCCCAG GCTACCCCAC CCCTCTCAGG AGCAGAGGCC 18 60 

GCGTATCACC ACGACAGAGC CCCGCGCCGT CCTCTGCTTC CCAGTCACCG TCCTCTGCCC 1920 

CTGGACACTT TGTCCAGCAT CAGGGAGGTT TCTGATCCGT CTGAAATTCA AGCCATGTCG 1980 

AACCTGCGGT CCTGAGCTTA ACAGCTTCTA CTTTCTGTTC TTTCTGTGTT GTGGAGACCC 2040 

TGAGAAGGAC CCTGGGAGCT CTGGGAATTT GGAGTGACCA AAGGTGTGC 203 9 
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Patentanspriiche 

1 . Katalytisch aktive humane Telomerase-Untereinheit, ihre funktionellen Aquivalente, 
ihre Varianten und ihre katalytisch aktiven Fragmente. 

2. Telomerase gemafl Anspruch 1, enthaltend die Aminosauresequenz gemaB Abb. 2 
oder deren funktionelle Aquivalente. 

3. Nucleinsauresequenzen codierend fiir Verbindungen gemaB den Anspriichen 1 und 2 
und ihre funktionellen Aquivalente. 

4. Nucleinsauresequenzen gemaB Anspruch 3, enthaltend die DNA-Sequenz aus Abb. 
I oder ihre funktionellen Aquivalente. 

5. Antisense-Nucleinsauresequenz bindend an die Nucleinsauresequenz gemaB 
Anspruch 3 oder 4. 

6. Antikorper gegen Telomerase gemaB den Anspruchen 1 und 2, gegebenenfalls 
markiert mit einem oder mehreren Markern. 

7. Verwendung von Nucleinsauresequenzen gemaB den Anspruchen 3 und 4 zur Her- 
stellung von Telomerase. 

8. Verwendung von Antikorpern gemaB Anspruch 6 zur Diagnose. 

9. Verwendung von Antikorpern gemaB Anspruch 6 zur Herstellung von Arznei- 
mitteln. 

10. Vektor enthaltend eine Nucleinsauresequenz, insbesondere DNA, gemaB Anspruch 
3 und 4. 

1 1 . Mikroorganismen enthaltend den Vektor gemaB Anspruch 10. 
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12. Screening Assay zur AufFindung von Modulatoren der humanen Telomerase ent- 
haltend die Telomerase gemaB den Anspriichen 1 und 2. 

13. Verfahren zur Herstellung der Telomerase gemaB den Anspriichen 1 und 2, dadurch 
gekennzeichnet, daB man den Mikroorganismus gemaB Anspruch 1 1 kultiviert und 
die Telomerase isoliert. 
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GTTTCAGGCA GCGCTGCGTC CTGCTGCGCA CGTGGGAAGC CCTGGCCCCG GCCACCCCCG CGATGCCGCG 70 
CGCTCCCCGC TGCCGAGCCG TGCGCTCCCT GCTGCGCAGC CACTACCGCG AGGTGCTGCC GCTGGCCACG 140 
TTCGTGCGGC GCCTGGGGCC CCAGGGCTGG CGGCTGGTGC AGCGCGGGGA CCCGGCGGCT TTCCGCGCGC 210 
TGGTGGCCCA GTGCCTGGTG TGCGTGCCCT GGGACGCACG GCCGCCCCCC GCCGCCCCCT CCTTCCGCCA 280 
GGTGTCCTGC CTGAAGGAGC TGGTGGCCCG AGTGCTGCAG AGGCTGTGCG AGCGCGGCGC GAAGAACGTG 350 
CTGGCCTTCG GCTTCGCGCT GCTGGACGGG GCCCGCGGGG GCCCCCCCGA GGCCTTCACC ACCAGCGTGC 420 
GCAGCTACCT GCCCAACACG GTGACCGACG CACTGCGGGG GAGGGGGGCG TGGGGGCTGC TGCTGCGCCG 490 
CGTGGGCGAC GACGTGCTGG TTCACCTGCT GGCACGCTGC GCGCTCTTTG TGCTGGTGGC TCCCAGCTGC 560 
GCCTACCAGG TGTGCGGGCC GCCGCTGTAC CAGCTCGGCG CTGCCACTCA GGCCCGGCCC CCGCCACACG 630 
CTAGTGGACC CCGAAGGCGT CTGGGATGCG AACGGGCCTG GAACCATAGC GTCAGGGAGG CCGGGGTCCC 700 
CCTGGGCCTG CCAGCCCCGG GTGCGAGGAG GCGCGGGGGC AGTGCCAGCC GAAGTCTGCC GTTGCCCAAG 770 
AGGCCCAGGC GTGGCGCTGC CCCTGAGCCG GAGCGGACGC CCGTTGGGCA GGGGTCCTGG GCCCACCCGG 840 
GCAGGACGCG TGGACCGAGT GACCGTGGTT TCTGTGTGGT GTCACCTGCC AGACCCGCCG AAGAAGCCAC 910 
CTCTTTGGAG GGTGCGCTCT CTGGCACGCG CCACTCCCAC CCATCCGTGG GCCGCCAGCA CCACGCGGGC 980 
CCCCCATCCA CATCGCGGCC ACCACGTCCC TGGGACACGC CTTGTCCCCC GGTGTACGCC GAGACCAAGC 1050 
ACTTCCTCTA CTCCTCAGGC GACAAGGAGC AGCTGCGGCC CTCCTTCCTA CTCAGCTCTC TGAGGCCCAG 1120 
CCTGACTGGC GCTCGGAGGC TCGTGGAGAC CATCTTTCTG GGTTCCAGGC CCTGGATGCC AGGGACTCCC 1190 
CGCAGGTTGC CCCGCCTGCC CCAGCGCTAC TGGCAAATGC GGCCCCTGTT TCTGGAGCTG CTTGGGAACC 1260 
ACGCGCAGTG CCCCTACGGG GTGCTCCTCA AGACGCACTG CCCGCTGCGA GCTGCGGTCA CCCCAGCAGC 1330 
CGGTGTCTGT GCCCGGGAGA AGCCCCAGGG CTCTGTGGCG GCCCCCGAGG AGGAGGACAC AGACCCCCGT 1400 
CGCCTGGTGC AGCTGCTCCG CCAGCACAGC AGCCCCTGGC AGGTGTACGG CTTCGTGCGG GCCTGCCTGC 14 70 
GCCGGCTGGT GCCCCCAGGC CTCTGGGGCT CCAGGCACAA CGAACGCCGC TTCCTCAGGA ACACCAAGAA 1540 
GTTCATCTCC CTGGGGAAGC ATGCCAAGCT CTCGCTGCAG GAGCTGACGT GGAAGATGAG CGTGCGGGAC 16 10 
TGCGCTTGGC TGCGCAGGAG CCCAGGGGTT GGCTGTGTTC CGGCCGCAGA GCACCGTCTG CGTGAGGAGA 169 0 
TCCTGGCCAA GTTCCTGCAC TGGCTGATGA GTGTGTACGT CGTCGAGCTG CTCAGGTCTT TCTTTTATGT 1750 
CACGGAGACC ACGTTTCAAA AGAACAGGCT CTTTTTCTAC CGGAAGAGTG TCTGGAGCAA GTTGCAAAGC 1820 
ATTGGAATCA GACAGCACTT GAAGAGGGTG CAGCTGCGGG AGCTGTCGGA AGCAGAGGTC AGGCAGCATC 1890 
GGGAAGCCAG GCCCGCCCTG CTGACGTCCA GACTCCGCTT CATCCCCAAG CCTGACGGGC TGCGGCCGAT 1960 
TGTGAACATG GACTACGTCG TGGGAGCCAG AACGTTCCGC AGAGAAAAGA GGGCCGAGCG TCTCACCTCG 2030 
AGGGTGAAGG CACTGTTCAG CGTGCTCAAC TACGAGCGGG CGCGGCGCCC CGGCCTCCTG GGCGCCTCTG 2100 
TGCTGGGCCT GGACGATATC CACAGGGCCT GGCGCACCTT CGTGCTGCGT GTGCGGGCCC AGGACCCGCC 2170 
GCCTGAGCTG TACTTTGTCA AGGTGGATGT GACGGGCGCG TACGACACCA TCCCCCAGGA CAGGCTCACG 2240 
GAGGTCATCG CCAGCATCAT CAAACCCCAG AACACGTACT GCGTGCGTCG GTATGCCGTG GTCCAGAAGG 2310 
CCGCCCATGG GCACGTCCGC AAGGCCTTCA AGAGCCACGT CTCTACCTTG ACAGACCTCC AGCCGTACAT 2380 
GCGACAGTTC GTGGCTCACC TGCAGGAGAC CAGCCCGCTG AGGGATGCCG TCGTCATCGA GCAGAGCTCC 2450 
TCCCTGAATG AGGCCAGCAG TGGCCTCTTC GACGTCTTCC TACGCTTCAT GTGCCACCAC GCCGTGCGCA 2S20 
TCAGGGGCAA GTCCTACGTC CAGTGCCAGG GGATCCCGCA GGGCTCCATC CTCTCCACGC TGCTCTGCAG 2590 
CCTGTGCTAC GGCGACATGG AGAACAAGCT GTTTGCGGGG ATTCGGCGGG ACGGGCTGCT CCTGCGTTTG 2660 
GTGGATGATT TCTTGTTGGT GACACCTCAC CTCACCCACG CGAAAACCTT CCTCAGOACC CTGGTCCGAG 2730 
GTGTCCCTGA GTATGGCTGC GTGGTGAACT TGCGGAAGAC AGTGGTGAAC TTCCCTGTAG AAGACGAGGC 2800 
CCTGGGTGGC ACGGCTTTTG TTCAGATGCC GGCCCACGGC CTATTCCCCT GGTGCGGCCT GCTGCTGGAT 2870 
ACCCGGACCC TGGAGGTGCA GAGCGACTAC ' TCCAGCTATG CCCGGACCTC CATCAGAGCC AGTCTCACCT 2940 
TCAACCGCGG CTTCAAGGCT GGGAGGAACA TGCGTCGCAA ACTCTTTGGG GTCTTGCGGC TGAAGTGTCA 3010 
CAGCCTGTTT CTGGATTTGC AGGTGAACAG CCTCCAGACG GTGTGCACCA ACATCTACAA GATCCTCCTG 3080 
CTGCAGGCGT ACAGGTTTCA CGCATGTGTG CTGCAGCTCC CATTTCATCA GCAAGTTTGG AAGAACCCCA 3150 
CATTTTTCCT GCGCGTCATC TCTGACACGG CCTCCCTCTG CTACTCCATC CTGAAAGCCA AGAACGCAGG 3220 
GATGTCGCTG GGGGCCAAGG GCGCCGCCGG CCCTCTGCCC TCCGAGGCCG TGCAGTGGCT GTGCCACCAA 3290 
GCATTCCTGC TCAAGCTGAC TCGACACCGT GTCACCTACG TGCCACTCCT GGGGTCACTC AGGACAGCCC 3360 
AGACGCAGCT GAGTCGGAAG CTCCCGGGGA CGACGCTGAC TGCCCTGGAG GCCGCAGCCA ACCCGGCACT 3430 
GCCCTCAGAC TTCAAGACCA TCCTGGACTG ATGGCCACCC GCCCACAGCC AGGCCGAGAG CAGACACCAG 3500 
CAGCCCTGTC ACGCCGGGCT CTACGTCCCA GGGAGGGAGG GGCGGCCCAC ACCCAGGCCC GCACCGCTGG 3570. 
GAGTCTGAGG CCTGAGTGAG TGTTTGGCCG AGGCCTGCAT GTCCGGCTGA AGGCTGAGTG TCCGGCTGAG 3640 
GCCTGAGCGA GTGTCCAGCC AAGGGCTGAG TGTCCAGCAC ACCTGCCGTC TTCACTTCCC CACAGGCTGG 3710 
CGCTCGGCtC CACCCCAGGG CCAGCTTTTC CTCACCAGGA GCCCGGCTTC CACTCCCCAC ATAOGAATAG 3780 
TCCATCCCCA GATTCGCCAT TGTTCACCCC TCGCCCTGCC CTCCTTTGCC TTCCACCCCC ACCATCCAGG 3850 
TGGAGACCCT GAGAAGGACC CTGGGAGCTC TGGGAATTTG GAGTGACCAA AGGTGTGCCC TGTACACAGG 3920 
CGAGGACCCT GCACCTGGAT GGGGGTCCCT GTGGGTCAAA TTGGGGGGAG GTGCTGTGGG AGTAAAATAC 3 990 
TGAATATATG AGTTTTTCAG TTTTGAAAAA AAAAAAAAAA AAAAAAAAAA AA 4 042 
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Fig 2 

MPRAPRCRAV RSLLRSHYRE VLPLATFVRR LGPQGWRLVQ RGDPAAFRAL 50 
VAQCLVCVPW DARPPPAAPS FRQVSCLKEL VARVLQRLCE RGAKNVLAFG 100 
FALLDGARGG PPEAFTTSVR SYLPNTVTDA LRGSGAWGLL LRRVGDDVLV 150 
HLLARCALFV LVAPSCAYQV CGPPLYQLGA ATQARPPPHA SGPRRRLGCE 200 
RAWNHSVREA GVPLGLPAPG ARRRGGSASR SLPLPKRPRR GAAPEPERTP 25 0 
VGQGSWAHPG RTRGPSDRGF CWSPARPAE EATSLEGALS GTRHSHPSVG 300 
RQHHAGPPST SRPPRPWDTP CPPVYAETKH FLYSSGDKEQ LRPSFLLSSL 350 
RPSLTGARRL VETIFLGSRP WMPGTPRRLP RLPQRYWQMR PLFLELLGNH 400 
AQCPYGVLLK THCPLRAAVT PAAGVCAREK PQGSVAAPEE EDTDPRRLVQ 450 
LLRQHSSPWQ VYGFVRACLR RLVPPGLWGS RHNERRFLRN TKKFISLGKH 500 
AKLSLQELTW KMSVRDCAWL RRSPGVGCVP AAEHRLREEI LAKFLHWLMS 550 
VYWELLRSF FYVTETTFQK NRLFFYRKSV WSKLQSIGIR QHLKRVQLRE 600 
LSEAEVRQHR EARPALLTSR LRFIPKPDGL RPIVNMDYW GARTFRREKR 650 
AERLTSRVKA LFSVLNYERA RRPGLLGASV LGLDDIHRAW RTFVLRVRAQ 700 
DPPPELYFVK VDVTGAYDTI PQDRLTEVIA SIIKPQNTYC VRRYAWQKA 750 
AHGHVRKAFK SHVSTLTDLQ PYMRQFVAHL QETSPLRDAV VIEQSSSLNE 800 
ASSGLFDVFL RFMCHHAVRI RGKSYVQCQG IPQGSILSTL LCSLCYGDME 850 
NKLFAGIRRD GLLLRLVDDF LLVTPHLTRA KTFLRTLVRG VPEYGCWNL 900 
RKTWNFPVE DEALGGTAFV QMPAHGLFPW CGLLLDTRTL EVQSDYSSYA 950 
RTSIRASLTF NRGFKAGRJNM RRKLFGVLRL KCHSLFLDLQ VNSLQTVCTN 1000 
IYKILLLQAY RFHACVLQLP FHQQVWKNPT FFLRVISDTA SLCYSILKAK 1050 
NAGMSLGAKG AAGPLPSEAV QWLCHQAFLL KLTRHRVTYV PLLGSLRTAQ 1100 
TQLSRKLPGT TLTALEAAAN PALPSDFKTI LD 1132 
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Fig 3 
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Fig8 8/15 

GTGCCTGCAG AGACCCGTCT GGTGCACTCT GATTCTCCAC TTGCCTGTTG CATGTCCTCG TTCCCTTGTT 70 

TCTCACCACC TCTTGGGTTG CCATGTGCGT TTCCTGCCGA GTGTGTGTTG ATCCTCTCGT TGCCTCCTGG 140 

TCACTGGGCA TTTGCTTTTA TTTCTCTTTG CTTAGTGTTA CCCCCTGATC TTTTTATTGT CGTTGTTTGC 210 

TTTTGTTTAT TGAGACAGTC TCACTCTGTC ACCCAGGCTG GAGTGTAATG GCACAATCTC GGCTCACTGC 280 

AACCTCTGCC TCCTCGGTTC AAGCAGTTCT CATTCCTCAA CCTCATGAGT AGCTGGGATT ACAGGCGCCC 350 

ACCACCACGC CTGGCTAATT TTTGTATTTT TAGTAGAGAT AGGCTTTCAC CATGTTGGCC AGGCTGGTCT 420 

CAAACTCCTG ACCTCAAGTG ATCTGCCCGC CTTGGCCTCC CACAGTGCTG GGATTACAGG TGCAAGCCAC 490 

CGTGCCCGGC ATACCTTGAT CTTTTAAAAT GAAGTCTGAA ACATTGCTAC CCTTGTCCTG AGCAATAAGA 560 

CCCTTAGTGT ATTTTAGCTC TGGCCACCCC CCAGCCTGTG TGCTGTTTTC CCTGCTGACT TAGTTCTATC 630 

TCAGGCATCT TGACACCCCC ACAAGCTAAG CATTATTAAT ATTGTTTTCC GTGTTGAGTG TTTCTTTAGC 700 

TTTGCCCCCG CCCTGCTTTT CCTCCTTTGT TCCCCGTCTG TCTTCTGTCT CAGGCCCGCC GTCTGGGGTC 770 

CCCTTCCTTG TCCTTTGCGT GGTTCTTCTG TCTTGTTATT GCTGGTAAAC CCCAGCTTTA CCTGTGCTGG 840 

CCTCCATGGC ATCTAGCGAC GTCCGGGGAC CTCTGCTTAT GATGCACAGA TGAAGATGTG GAGACTCACG 910 

AGGAGGGCGG TCATCTTGGC CCGTGAGTGT CTGGAGCACC ACGTGGCCAG CGTTCCTTAG CCAGGGTTGG 980 

CTGTGTTCCG GCCGCAGAGC ACCGTCTGCG TGAGGAGATC CTGGCCAAGT TCCTGCACTG GCTGATGAGT 1050 

GTGTACGTCG TCGAGCTGCT CAGGTCTTTC TTTTATGTCA CGGAGACCAC GTTTCAAAAG AACAGGCTCT 1120 

TTTTCTACCG GAAGAGTGTC TGGAGCAAGT TGC 1153 



Fig 9 

CAGAGCCCTG GTCCTCCTGT CTCCATCGTC ACGTGGGCAC ACGTGGCTTT TCGCTCAGGA CGTCGAGTGG 70 

ACACGGTGAT CTCTGCCTCT GCTCTCCCTC CTGTCCAGTT TGCATAAACT TACGAGGTTC ACCTTCACGT 140 

TTTGATGGAC ACGCGGTTTC CAGGCACCGA GGCCAGAGCA GTGAACAGAG GAGGCTGGGC GCGGCAGTGG 210 

AGCCGGGTTG CCGGCAATGG GGAGAAGTGT CTGGAAGCAC AGACGCTCTG GCGAGGGTGC CTGCAGAGAC 260 

CCGCCTGGTG CACTCTGATT CTCCACTTGC CTGTTGCATG TCCTCGTTCC CTTGTTTCTC ACCACCTCTT 350 

GGGTTGCCAT GTGCGTTTCC TGCCGAGTGT GTGTTGATCC TCTCGTTGCC TCCTGGTCAC TG 412 



Fig 10 

GGGGTCCTGG GCCCACCCGG GCAGGACGCG TGGACCGAGT 

AGACCCGCCG AAGAAGCCAC CTCTTTGGAG GGTGCGCTCT 

GCCGCCAGCA CCACGCGGGC CCCCCATCCA CATCGCGGCC 

GGTGTACGCC GAGACCAAGC ACTTCCTCTA CTCCTCAGGC 

CTCAGCTCTC TGAGGCCCAG CCTGACTGGC GCTCGGAGGC 

CCTGGATGCC AGGGACTCCC CGCAGGTTGC CCCGCCTGCC 

TCTGGAGCTG CTTGGGAACC ACGCGCAGTG CCCCTACGGG 

GCTGCGGTCA CCCCAGCAGC CGGTGTCTGT GCCCGGGAGA 

AGGAGGACAC AGACCCCCGT CGCCTGGTGC AGCTGCTCCG 

CTTCGTGCGG GCCTGCCTGC GCCGGCTGGT GCCCCCAGGC 

TTCCTCAGGA ACACCAAGAA GTTCATCTCC CTGGGGAAGC 

GGAAGATGAG CGTGCGGGAC TGCGCTTGGC TGCGCAGGAG 

CCCAGGCCCC AGAGCTGAAT GCAGTAGGGG CTCAGAAAAG 

CCATCGTCAC GTGGGCACAC GTGGCTTTTC GCTCAGGACG 

TCrCCCTCCT GTCCAGTTTG CATAAACTTA CG 



GACCGTGGTT 


TCTGTGTGGT 


GTCACCTGCC 


70 


CTGGCACGCG 


CCACTCCCAC 


CCATCCGTGG 


140 


ACCACGTCCC 


TGGGACACGC 


CTTGTCCCCC 


210 


GACAAGGAGC 


AGCTGCGGcC 


CTCCTTCCTA 


280 


TCGTGGAGAC 


CATCTTTCTG 


GGTTCCAGGC 


350 


CCAGCGCTAC 


TGGCAAATGC 


GGCCCCTGTT 


420 


GTGCTCCTCA 


AGACGCACTG 


CCCGCTGCGA 


490 


AGCCCCAGGG 


CTCTGTGGCG 


GCCCCCGAGG 


560 


CCAGCACAGC 


AGCCCCTGGC 


AGGTGTAOGG 


630 


CTCTGGGGCT 


CCAGGCACAA 


CGAACGCCGC 


700 


ATGCCAAGCT 


CTCGCTGCAG 


GAGCTGACGT 


770 


CCCAGGTGAG 


GAGGTGGTGG 


CCGTCGAGGG 


840 


GGGGCAGGCA 


GAGCCCTGGT 


CCTCCTGTCT 


910 


TCGAGTGGAC 


ACGGTGATCT 


CTGCCTCTGC 


980 
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Fig 11 

GAATTCGCGG CCGCGTCGAC GTTTCAGGCA GCGCTGCGTC CTGCTGCGCA CGTGGGAAGC CCTGGCCCCG 70 
GCCACCCCCG CGATGCCGCG CGCTCCCCGC TGCCGAGCCG TGCGCTCCCT GCTGCGCAGC CACTACCGCG 140 
AGGTGCTGCC GCTGGCCACG TTCGTGCGGC GCCTGGGGCC CCAGGGCTGG CGGCTGGTGC AGCGCGGGGA 210 
CCCGGCGGCT TTCCGCGCGC TGGTGGCCCA GTGCCTGGTG TGCGTGCCCT GGGACGCACG GCCGCCCCCC 280 
GCCGCCCCCT CCTTCCGCCA GGTGTCCTGC CTGAAGGAGC TGGTGGCCCG AGTGCTGCAG AGGCTGTGCG 350 
AGCGCGGCGC GAAGAACGTG CTGGCCTTCG GCTTCGCGCT GCTGGACGGG GCCCGCGGGG GCCCCCCCGA 420 
GGCCTTCACC ACCAGCGTGC GCAGCTACCT GCCCAACACG GTGACCGACG CACTGCGGGG GAGCGGGGCG 490 
TGGGGGCTGC TGCTGCGCCG CGTGGGCGAC GACGTGCTGG TTCACCTGCT GGCACGCTGC GCGCTCTTTG 560 
TGCTGGTGGC TCCCAGCTGC GCCTACCAGG TGTGCGGGCC GCCGCTGTAC CAGCTCGGCG CTGCCACTCA 630 
GGCCCGGCCC CCGCCACACG CTAGTGGACC CCGAAGGCGT CTGGGATGCG AACGGGCCTG GAACCATAGC 700 
GTCAGGGAGG CCGGGGTCCC CCTGGGCCTG CCAGCCCCGG GTGCGAGGAG GCGCGGGGGC AGTGCCAGCC 770 
GAAGTCTGCC GTTGCCCAAG AGGCCCAGGC GTGGCGCTGC CCCTGAGCCG GAGCGGACGC CCGTTGGGCA 840 
GGGGTCCTGG GCCCACCOGG GCAGGACGCG TGGACCGAGT GACCGTGGTT TCTGTGTGGT GTCACCTGCC 910 
AGACCCGCCG AAGAAGCCAC CTCTTTGGAG GGTGCGCTCT CTGGCACGCG CCACTCCCAC CCATCCGTGG 980 
GCCGCCAGCA CCACGCGGGC CCCCCATCCA CATCGCGGCC ACCACGTCCC TGGGACACGC CTTGTCCCCC 1050 
GGTGTACGCC GAGACCAAGC ACT7CCTCTA CTCCTCAGGC GACAAGGAGC AGCTGCGGCC CTCCTTCCTA 1120 
CTCAGCTCTC TGAGGCCCAG CCTGACTGGC GCTCGGAGGC TCGTGGAGAC CATCTTTCTG GGTTCCAGGC 1190 
CCTGGATGCC AGGGACTCCC CGCAGGTTGC CCCGCCTGCC CCAGCGCTAC TGGCAAATGC GGCCCCTGTT 1260 
TCTGGAGCTG CTTGGGAACC ACGCGCAGTG CCCCTACGGG GTGCTCCTCA AGACGCACTG CCCGCTGCGA 1330 
GCTGCGGTCA CCCCAGCAGC CGGTGTCTGT GCCCGGGAGA AGCCCCAGGG CTCTGTGGCG GCCCCCGAGG 1400 
AGGAGGACAC AGACCCCCGT CGGCTGGTGC AGCTGCTCCG CCAGCACAGC AGCCCCTGGC AGGTGTACGG 1470 
CTTCGTGCGG GCCTGCCTGC GCCGGCTGGT GCCCCCAGGC CTCTGGGGCT CCAGGCACAA CGAACGCCGC 1540 
TTCCTCAGGA ACACCAAGAA GTTCATCTCC CTGGGGAAGC ATGCCAAGCT CTCGCTGCAG GAGCTGACGT 1610 
GGAAGATGAG CGTGCGGGAC TGCGCTTGGC TGCGCAGGAG CCCAGGTGAG GAGGTGGTGG CCGTCGAGGG 1680 
CCCAGGCCCC AGAGCTGAAT GCAGTAGGGG CTCAGAAAAG GGGGCAGGCA GAGCCCTGGT CCTCCTGTCT 1750 
CCATCGTCAC GTGGGCACAC GTGGCTTTTC GCTCAGGACG TCGAGTGGAC ACGGTGATCT CTGCCTCTGC 1820 
TCTCCCTCCT GTCCAGTTTG CATAAACTTA CGAGGTTCAC CTTCACGTTT TGATGGACAC GCGGTTTCCA 1890 
GGCGCCGAGG CCAGAGCAGT GAACAGAGGA GGCTGGGCGC GGCAGTGGAG CCGGGTTGCC GGCAATGGGG 1960 
AGAAGTGTCT GGAAGCACAG ACGCTCTGGC GAGGGTGCCT GCAGGGGTTG GCTGTGTTCC GGCCGCAGAG 2030 
CACCGTCTGC GTGAGGAGAT CCTGGCCAAG TTCCTGCACT GGCTGATGAG TGTGTACGTC GTCGAGCTGC 2100 
TCAGGTCTTT CTTTTATGTC ACGGAGACCA CGTTTCAAAA GAACAGGCTC TTTTTCTACC GGAAGAGTGT 2170 
CTGGAGCAAG TTGCAAAGCA TTGGAATCAG ACAGCACTTG AAGAGGGTGC AGCTGCGGGA GCTGTCGGAA 2240 
GCAGAGGTCA GGCAGCATCG GGAAGCCAGG CCCGCCCTGC TGACGTCCAG ACTCCGCTTC ATCCCCAAGC 2310 
CTGACGGGCT GCGGCCGATT GTGAACATGG ACTACGTCGt GGGAGCCAGA ACGTTCCGCA GAGAAAAGAG 2380 
GGTGGCTGTG CTTTGGTTTA ACTTCCTTTT TAAACAGAAG TGCGTTTGAG CCCCACATTT GGTATCAGCT 2450 
TAGATGAAGG GCCCGGAGGA GGGGCCACGG GACACAGCCA GGGCCATGGC ACGGCGCCAA CCCATTTGTG 2520 
CGCACGGTGA GGTGGCCGAG GTGCCGGTGC CTCCAGAAAA GCAGCGTGGG GGTGTAGGGG GAGCTCCTGG 2590 
GGCAGGGACA GGCTCTGAGG ACCACAAGAA GCAGCTGGGC CAGGGCCTGG ATGCAGCACG GCCCGAGCGG 2660 
GTGGGGGCCC ACCACGCCAT TCTGGTCAAA GGTGTTGTAG TCGTAATAGC CGGCCCAGGC GCTCTGAACC 2730 
TTCAGAGTCT CAAAAGCTGG GACCCTCAGG .GCCAAATGGG GCCACACCTT GTCCTGGAAG AAATCATGGT 2800 
CCACTTCCAG GTTCGCCGGG TCCGGTTCTT CCTGCTCAGT GGGGCTACGA CCACCTAGGT AGTTGCTACC 2870 
TAATCCTTCC CGGCGAAAAT AGGCTCCACT GGTGTCTGCA ACAAGCGGAG TCTCTAGGCC TGGTCCCTGG 2940 
GGGCAGTGCC ACACATACAC ATACC T TTTC CTCGGCTCCA CAGGTAGCTT GGTGCCCTGC AGGGTGCCAG 3010 
GCGGCCCCTC TCCAACACCA GCCAGTGCTG CGATTTGCGC AGACCAGGCT CCGGCTGCGT TGATCACAAT 3080 
GGCGCATTCC ACAGGCTGGT ACTCCAGGCT GCGGTCCATC TTCACATGGA CTTCATGGAT CCTTTTCAAG 3150 
ACCACCGCTT TGTCATCTGT GGTCAACATG CGTTGAGATG AAGAGACAAA ACGTGTCACC TCTCCCTGGC 3220 
AGAAAAGGAC TCCCAAGGAC TGGACCTTTC GCCGAAGCCC CTGGAGCAGA CACCAGGGGT CAAACCAACC 3290 
TTCGTCCTCC ATCCCATAAG ACGCCAAAGC CACTCCCTCT GTGTTTATCC AGGGAAACTT GTTCCGAAGC 3360 
TGATCAGGAG ACATCAGAGA AACTTTGGCT CCCTCCTGCC TCTGCACTTT CACGTTGCTC TCCATGGCTG 3430 
CAGCATCCTT TTCTGAAGCC AGCAAGAGGT AGCCCGAGGG GTTGAACCGG AGGTCCAGGG GAGGAGCATC 3S00 
GACTACGGCC AGGTACTCAT TGATGTTCCG TAGAAAGCTG GCTGAAAAGA GGGAGAGCTG GATGTTCTCA 3570 
GGCAATGAGA ACTGCTGACA AATCCCACCT ACTGAGAGCC CAGTGGAGGC CTGTGAATAC GTGTGGTCCC 3640 
GTTCCACCAC TAGCACTCGA ATAGCACCTC GTCTGCTCTC CAGCTTCTTC AGCCAATAGG CCACAGACAA 3710 
GCCAAGCACC CCACCTCCCA CGATCACCAC ATCCGAGTGC TCGGGAGGCA GGTGGCTGGT GTCTTGCAGT 3780 
AGATCACAGG ACCTTCCAGG CAGGATCGAC TTGATCTTCT TCTTAATCTC AGACACCTTT CCATCCCAGT 3850 
CCAGAGAAAA GCCTCCTCTG CGCGTGCCTG GCCTCCGGGT CAAGAGGCCC CGGCCCATGC CGTGCGGCAG 3920 
AACCCTCCGA ATCATAGCCC CTCTGAGCCC GGGTCGACGC GGCCGCGAAT TC 3972 
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Fig .U 



CCGGAAGAGT 


GTCTGGAGCA 


AGTTGCAAAG 


CATTGGAATC 


AGACAGCACT 


TGAAGAGGGT 


GCAGCTGCGG 


1853 


GAGCTGTCGG 


AAGCAGAGGT 


CAGGCAGCAT 


CGGGAAGCCA 


GGCCCGCCCT 


GCTGACGTCC 


AGACTCCGCT 


1923 


TCATCCCCAA 


GCCTGACGGG 


CTGCGGCCGA 


TTGTGAACAT 


GGACTACGTC 


GTGGGAGCCA 


GAACGTTCCG 


1993 


CAGAGAAAAG 


AGGGCCGAGC 


GTCTCACCTC 


GAGGGTGAAG 


GCACTGTTCA 


GCGTGCTCAA 


CTACGAGCGG 


2063 


GCGCGGCGCC 


CCGGCCTCCT 


GGGCGCCTCT 


GTGCTGGGCC 


TGGACGATAT 


CCACAGGGCC 


TGGCGCACCT 


2133 


TCGTGCTGCG 


TGTGCGGGCC 


CAGGACCCGC 


CGCCTGAGCT 


GTACTTTGTC 


AAGGTGGATG 


TGACGGGCGC 


2203 


GTACGACACC 


ATCCCCCAGG 


ACAGGCTCAC 


GGAGGTCATC 


GCCAGCATCA 


TCAAACCCCA 


GAACACGTAC 


2273 


TGCGTGCGTC 


GGTATGCCGT 


GGTCCAGAAG 


GCCGCCCATG 


0*0*0* ft 0*0*tm0*0%0s 

GGCACGTCCG 


CAAGGCCTTC 


AAGAGCCACG 


2343 


TCTCTACCTT 


GACAGACCTC 


CAGCCGTACA 


TGCGACAGTT 


CGTGGCTCAC 


CTGCAGGAGA 


CCAGCCCGCT 


2413 


GAGGGGTGCC 


GTCGTCATCG 


AGCAGAGCTC 


CTCCCTGAAT 


GAGGCCAGCA 


GTGGCCTCTT 


CGACGTCTTC 


Hoi 


CTACGCTTCA 


TGTGCCACCA 


CGCCGTGCGC 


ATCAGGGGCA 


AGTCCTACGT 


CCAGTGCCAU 




499 J 


AGGGCTCCAT 


CCTCTCCACG 


CTGCTCTGCA 


0*0h\0*\0H0+tHf*0*V1 k .>\ 

GCCTGTGCTA 


CGGCGACATG 


GAGAACAAGC 


TGTTTGCGGG 


^ e o 1 
2623 


GATTOGGCGG 


GACGGGCTGC 


TCCTGCGTTT 


GGTGGATGAT 


TTCTTGTTGG 


TGACACCTCA 


CCTCACCCAC 


2593 


GCGAAAACCT 


TCCTCAGGAC 


CCTGGTCCGA 


GGTGTCCCTG 


AGTATGGCTG 


CGTGGTGAAC 


TTGCGGAAGA 


27S3 


CAGTGGTGAA 


CTTCCCTGTA 


GAAGACGAGG 


CCCTGGGTGG 


CACGGCTTTT 


GTTCAGATGC 


CGGCCCACGG 


2833 


CCTATTCCCC 


TGGTGCGGCC 


TGCTGCTGGA 


TACCCGGACC 


CTGGAGGTGC 


AGAGCGACTA 


CTCCAGCTAT 


2903 


GCCCGGACCT 


CCATCAGAGC 


CAGTCTCACC 


TTCAACCGCG 


GOTCAAGGC 


TGGGAGGAAC 


ATGCGTCGCA 


2973 


AACTCTTTGG 


GGTCTTGCGG 


CTGAAGTGTC 


ACAGCCTGTT 


TCTGGATTTG 


CAGGTGAACA 


GCCTCCAGAC 


3043 


GGTGTGCACC 


AACATCTACA 


AGATCCTCCT 


GCTGCAGGCG 


TACAGGTTTC 


ACGCATGCGT 


GCTGCAGCTC 


3113 


CCATTTCATC 


AGCAAGTTTG 


GAAGAACCCC 


ACATTTTTCC 


TGCGCGTCAT 


CTCTGACACG 


GCCTCCCTCT 


3183 


GCTACTCCAT 


CCTGAAAGCC 


AAGAACGGAG 


GTATGTGCAG 


GTGCCTGGCC 


TCAGTGGCAG 


CAGTGCCTGC 


3253 


CTGCTGGTGT 


TAGTGTGTCA 


GGAGACTGAG 


TGAATCTGGG 


CTTAGGAAGt 


TCTTACCCCT 


TTTCGCATCA 


3323 


GGAAGTGGTT 


TAACCCAACC 


ACTGTCAGGC 


TCGTCTGCCC 


GCCCTCTCGT 


GGGGTGAGCA 


GAGCACCTGA 


3393 


TGGAAGGGAC 


AGGAGCTGTC 


TGGGAGCTGC 


CATCCTTCCC 


ACCTTGCTCT 


GCCTGGGGAA 


GCGCTGGGGG 


3463 


GCCTGGTCTC 


TCCTGTTTGC 


CCCATGGTGG 


GATTTGGGGG 


GCCTGGCCTC 


TCCTGTTTGC 


CCTGTGGTGG 
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GATTGGGCTG 


TCTCCCGTCC 


ATGGCACTTA 


GGGCCCTTGT 


GCAAACCCAG 


GCCAAGGGCT 


TXGGAGGAGG 


3603 


CCAGGCCCAG 


GCTACCCCAC 


CCCTCTCAGG 
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GCGTATCACC 


ACGACAGAGC 
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CCTCTGCTTC 


CCAGTCACCG 


TCCTCTGCCC 


CTGGACACTT 


TGTCCAGCAT 


CAGGGAGGTT 


TCTGATCCGT 


3743 


CTGAAATTCA 


AGCCATGTCG 


AACCTGCGGT 


CCTGAGCTTA 


ACAGCTTCTA 


CTTTCTGTTC 


TTTCTGTGTT 


3813 



GTGGAGACCC TGAGAAGGAC CCTGGGAGCT CTGGGAATTT GGAGTGACCA AAGGTGTGC 3872 
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Fig 17 

12 3 kDa 
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(54) TiUe: HUMAN CATALYTIC TELOMERASE SUB-UNIT AND ITS DIAGNOSTIC AND THERAPEUTIC USE 

(54) Bezetchnung: HUMANE KATALYTTSCHE TELOMERASE-UNTEREINHEIT UND DEREN DIAGNOSTISCHE UND THERA- 
PEUTISCHE VERWENDUNG 

M7RAPROUV RSLLRSarUE VLFIATPVBR LOPQOWRLVQ EOOPXATOAL SO 
V&OCLVCVPW DURPPPAAPS rROVSCLXSL VWtVLQJILCJ KOMWIATO 100 
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XTKILLLOMT JtfKftCVLQLP FHQOVWKlfTT PFUtVISDXA «I.CTinJUUt 1010 

BxaxsLoixn mopi*ss*v owlckqajll xltuolytyv puosluxaq 1100 

TQLCRCPOT TLXALSUUW PftLPSDPKTI ID UJ2 



(57) Abstract 

The invention relates to the nucleotide sequence and the protein sequence derived therefrom, which encodes for the human catalytic 
telomerase sub-unit. The invention furthermore relates to methods involving a pharmaceutical, diagnostic or therapeutic use of this 
gene/protein, principally for treating cancer and ageing. 

(57) Zasammenfsssung 

Diese Erfmdung betrifft die Nukleotidsequenz und die davon abgelettete Proteinsequenz, die ftlr die humane katalyiische Telomerase- 
Untereinheit codiert. DarOberhinaus betrifft diese Erfmdung Methoden, die cine pharmazcutischc, diagnostische oder therapeutische 
Verwendung von diesem Gen/Protein beinhaltet, vor allem in der Behandlung von Krebs und Alterung. 
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